VMware startet Open-Source-Projekt für virtualisierte Hadoop-Cluster

13.06.2012

Das neue Serengeti-Projekt soll Hadoop-Installationen in virtualisierten Umgebungen und "Clouds" erleichtern und ihre Performance verbessern.

Die Firma VMware hat ein neues Open-Source-Projekt ins Leben gerufen , das es ermöglichen soll, die Cluster-Software Hadoop einfacher und performanter in virtuellen Umgebungen zu betreiben. Unter dem Namen "Serengeti" stellt es einen "One-Click-Installer" bereit, der Hadoop in einem Netz virtualisierten Knoten installiert. Derzeit ist dabei nur die Virtualisierungslösung vSphere von VMware unterstützt, prinzipiell der Support anderer Systeme nicht ausgeschlossen. Mit Serengeti lassen sich außerdem auf Hadoop basierende Anwendungen wie Hive (Data Warehouse) und Pig (Analyse großer Datenmengen) installieren.

Serengeti ist in Java geschrieben und steht als freie Software unter der Apache-Lizenz. Auf der Serengeti-Homepage steht das Image einer virtuellen vSphere-Appliance zum Download bereit. Künftig will VMware zusammen mit der Hadoop-Community daran arbeiten, dass Hadoop, das bisher auf Cluster physischer Rechner ausgelegt ist, besser mit virtualisierten Umgebungen funktioniert. So sollen beispielsweise das Hadoop Distributed File System (HDFS) und das Map-Reduce-Framework dahingehend optimiert werden.

Ähnliche Artikel

comments powered by Disqus
Mehr zum Thema

SQL Server findet Anschluss an Hadoop

Als Community Technology Preview veröffentlicht Microsoft einen Connector zwischen SQL Server und dem Hadoop-Cluster.

Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023