
- Hadoop - Inicio
- Hadoop - Grandes Datos Generales
- Hadoop - Grandes Soluciones de Datos
- Hadoop: Introducción
- Hadoop - Configuración Entorno
- Hadoop - HDFS Descripción General
- Hadoop - HDFS Operaciones
- Hadoop - Referencia de Comandos
- Hadoop - MapReduce
- Hadoop - Streaming
- Hadoop - Varios Nodos de Clúster
Hadoop - Grandes Soluciones de Datos
Enfoque empresarial tradicional
En este enfoque, la empresa tendr un equipo para almacenar y procesar grandes datos. Para el almacenamiento, los programadores tendrn la ayuda de su eleccin de proveedores de bases como Oracle, IBM, etc. En este enfoque, el usuario interacta con la aplicacin que, a su vez, controla la parte de almacenamiento de datos y anlisis.

Limitacin
Este mtodo funciona bien con las aplicaciones de las que menos voluminoso proceso datos que pueden ser atendidas por los servidores de la base estndar, o hasta el lmite del procesador que se est procesando los datos. Pero cuando se trata de hacer frente a enormes cantidades de datos escalable, es una frentica tarea de procesar los datos a travs de una base de datos nica botella.
Solucin de Google
Google soluciona este problema mediante un algoritmo llamado MapReduce. Este algoritmo divide la tarea en partes pequeas y los asigna a muchos equipos, y recopila los resultados de ellos que si se integra, forma el conjunto de datos de resultado.

Hadoop
Utilizando la solucin aportada por Google, Doug y su equipo desarrollaron un proyecto de Cdigo Abierto llamado HADOOP.
Hadoop ejecuta las aplicaciones utilizando el algoritmo MapReduce, donde los datos se procesan en paralelo con los dems. En resumen, Hadoop se utiliza para desarrollar aplicaciones que podran hacer un anlisis estadstico de grandes cantidades de datos.
