Diskutieren Hadoop



Hadoop ist ein Open-Source-Framework, die ermöglicht zu speichern und verarbeiten groß Datenmengen in einer verteilten Umgebung über Clustern von Computern verwendung einfachen Programmiermodelle. Es wurde entwickelt, um von einzel Servern zu skalieren herauf bis zu Tausenden von Maschinen,jeder Opfergabe lokale Berechnung und Speicherung.

Diese kurze Tutorial bietet einen schnellen Einstieg in groß Daten, Kartereduzieren-Algorithmus und Hadoop verteilt Dateisystem.

Advertisements