Discutir Hadoop



Hadoop é um open-source framework que permite armazenar e processar dados grandes em um ambiente distribuído entre clusters de computadores usando simples modelos de programação. Ele é projetado para aumentar a escala de servidores únicos para milhares de máquinas, cada uma delas oferecendo computação e armazenamento local.

Este breve tutorial fornece uma rápida introdução de dados grandes, MapReduce algoritmo e Hadoop Distributed File System.

Advertisements