Ich bin total neu mit Apache Spark, daher tut es mir sehr leid, wenn meine Frage naiv scheint, aber ich habe keine klare Antwort im Internet gefunden.Kann Apache Spark mehrere ähnliche Zeilen in einer Zeile zusammenführen?
Hier ist der Kontext meines Problems: Ich möchte JSON-Eingabedaten von einem Apache Kafka-Server abrufen. Das Format ist wie folgt:
{"deviceName":"device1", "counter":125}
{"deviceName":"device1", "counter":125}
{"deviceName":"device2", "counter":88}
{"deviceName":"device1", "counter":125}
{"deviceName":"device2", "counter":88}
{"deviceName":"device1", "counter":125}
{"deviceName":"device3", "counter":999}
{"deviceName":"device3", "counter":999}
Mit Funken oder mit Streaming-Funken, ich mag diese Daten verarbeiten und als Ausgang das folgende Format zu erhalten:
{"deviceName":"device1", "counter":125, "nbOfTimes":4}
{"deviceName":"device2", "counter":88, "nbOfTimes":2}
{"deviceName":"device3", "counter":999, "nbOfTimes":2}
Also, ich würde gerne wissen, ob Was ich suche, ist mit Spark möglich. Und wenn ja, kannst du mir eine Anleitung geben? Ich wäre so dankbar.
Joe
Haben Sie eine Idee, wie es mit Spark-Streaming gemacht werden kann? –
keine Ahnung, und in Java? –
Funken-Streaming wird der gleichen Idee folgen. Aber Sie arbeiten nur mit Mikro-RDDs. Ich sehe nicht, wie das nützlich sein kann. – eliasah