einen Strom von SparkFlumeEvents Given (oder sagen, jede DSTREAM) Wie funktioniert eine Karte zu einem geeigneten Schema, so dass der Strom mitSpark-Streaming-Schema
zu Cassandra gespeichert werden könnenstream.saveToCassandra(keyspace,table)
ein naiver Versuch, beschwert sich über fehlende Spalten .
Ist der beste Ansatz zu stream.map() zu einem gegebenen Objekt (was schwerfällig erscheint)?
OR ...
ein anderer Ansatz scheint stream.foreachRDD zu verwenden und irgendwie an einen Datenrahmen zuordnen. Das erscheint auch umständlich, da die Stream-Methode das direkte Speichern von cassandra unterstützt.
Also, was ist der richtige Weg?
tut Ihr Code übernimmt jedoch, dass der ankommende Streaming die richtigen Spalten hat - ich diesen Ansatz in der Dokumentation gesehen habe, aber meine Hauptfrage ist mehr um die Idee von Transformationen und Mapping-Schema - zum Beispiel muss ich möglicherweise die Bytes eines Streams in einer benutzerdefinierten Weise deserialisieren oder eine Spaltenzuordnung durchführen. Ich frage mich, was ist der sauberste Weg, um diese Mappings/Decoder zu spezifizieren? – ismisesisko