Amazon, Cloudera, Hortonworks, MapR & Co.

Hadoop-Distributionen im Kurzprofil

21.07.2014
Von 
Bernd Reder ist freier Journalist und Autor mit den Schwerpunkten Technologien, Netzwerke und IT in München.

MapR - die M-Serie

MapR stellt laut einem Test von Flux7 eine Hadoop-Distribution zur Verfügung, die sich durch besonders hohe Performance auszeichnet. Dazu trägt das hauseigene File-System MapR-FS bei, das anstelle des Original-Dateisystems HDFS von Hadoop zum Zuge kommt. Weitere Besonderheiten sind die Unterstützung von NFS (Network File System), Änderungen an HBase, die sich in kürzeren Antwortzeiten niederschlagen, sowie die Option, unterschiedlichen Programmcode im Cluster laufen zu lassen.

Multi-Node-Direct-Access-NFS von MapR ermöglicht es, das Dateisystem von MapR als NFS-Ressourcen zu mounten. Dadurch können Anwendungen auf traditionelle Weise auf Hadoop-Daten zugreifen. Interessanterweise nutzen auch Amazon und Google die Technologie von MapR für ihre Hadoop-Angebote. Dennoch, so die Beratungsgesellschaft Forrester Research, gilt MapR im Vergleich zu Cloudera und Hortonworks immer noch als Geheimtipp. Was die Technologie betrifft, stuft Forrester das Unternehmen dagegen als einen der führenden Hadoop- Protagonisten ein.

MapR bietet derzeit drei Versionen seiner Distribution an. "M3" ist die kostenlose Standardversion von Apache Hadoop. "M5 Enterprise" bietet eine Verfügbarkeit von 99,999 Prozent und unterstützt Snapshots und Mirroring. Die "M7 Enterprise Edition" ist die leistungsstärkste Ausgabe, inklusive einer schnellen Online-Datenbank und einer Schnittstelle zu HBase, um Usern die Wahl zwischen mehreren Datenbanksystemen zu lassen.