Als ich die ersten N Datensätze in Apache wollen Funken nur nehmen ich benutze:Warum liest env.readTextFile (...). First (10) .print in Flink alle Daten?
sc.textFile(path_to_files).take(10)
die sich schnell zurück und geben Sie mir die ersten 10 Zeilen Text. Wenn ich etwas ähnliches in Apache Flink:
env.readTextFile(path_to_files).first(10).print()
Es werden alle Dateien vollständig lesen, bevor die Ergebnisse zurück. Warum das?
Danke, das macht Sinn. – gvd