Ich habe einen Spark-Code, wo der Code in Call-Methode Aufruf an die memSQL-Datenbank zum Lesen aus einer Tabelle. Mein Code öffnet jedes Mal ein neues Verbindungsobjekt und schließt es, nachdem die Aufgabe erledigt ist. Dieser Aufruf erfolgt innerhalb der Call-Methode. Dies funktioniert gut, aber die Ausführungszeit für den Spark-Job wird hoch. Was wäre ein besserer Weg, dies zu tun, so dass die Ausführungszeit des Funkencodes reduziert wird.Was ist die richtige Art der Verwendung von memSQL Connection-Objekt in Call-Methode von Apache Spark-Code
Vielen Dank.
Dank. Ich arbeite gerade daran, meinen Code zu ändern, um dies zu verwenden. –
Dies dient zum Speichern in einem externen System, während ich es zum Lesen von einem externen System benötige. Die Funkenführung sagt "Diese Funktion sollte die Daten in jeder RDD zu einem externen System, wie das RDD in Dateien speichern oder über das Netzwerk in eine Datenbank schreiben." Ich benötige es zum Lesen von einem externen System. Danke –
Ich habe die Antwort aktualisiert, hoffe, dass dies das ist, was Sie suchen. –