Java Flink – Eine Open Source Plattform für die Verarbeitung großer Datenmengen
Im Rahmen eines Java-Projektes sind wir mit Flink in Verbindung gekommen. Wir waren von der Datenverarbeitung mit Flink sehr begiestert und wollen in diesem Blog zuerst die Grundlagen und dann einige Ergebnisse unserer Arbeit vorstellen. Dieser Post ist dabei erstmal eine Einführung in die Grundlagen von Flink.
Was ist Flink?
Grob gesagt ist Flink eine Java-Erweiterung (Flink gibt es auch für Scala) die dabei hilft große Datenmengen verteilt zu verarbeiten. Eine verteilte Verarbeitung kann innerhalb eines Computers auf mehreren Prozessorkernen, innerhalb eines Unternehmensnetzwerkes oder aber auch über verschiedene global-verteilte Cluster geschehen. Flink hiflt einem dabei von dieser Verteilung zu abstrahieren. Die Programmierung mit Flink unterscheidet sich jedoch in einigen Punkten von der Programmierung die man sonst mit Java gewohnt ist.
Mehr Erfahren