iX-Report: Apache-Projekte zur Analyse großer Datenmengen

Hadoop, Storm, Kafka, Calcite, Zeppelin, Hive, Spark, Sqoop… Unter dem Dach der Apache Software Foundation wächst ein immer umfassenderes Repertoire quelloffener Big-Data-Software. Manche Projekte bringen dabei ganz ähnliche Funktionen für ähnliche Aufgaben mit. Für Entwickler und Data Scientists stellt sich zunehmend die Herausforderung, die passende Apache-Software für ihr Vorhaben zu finden. Stephanie Fischer und Dr. Christian Winkler von mgm geben in der Juni-Ausgabe der iX einen Überblick zu den aktuellen Apache-Projekten. In einer funktionalen Landkarte der Big Data Welt werden die Projekte zunächst in verschiedene Kategorien eingeordnet. Anschließend werden die Unterschiede von Projekten mit ähnlichen Funktionalitäten diskutiert.

Share