Ich verstehe, wie Arbeiterknoten fehlertolerant sind, aber was passiert, wenn Ihr Treiberprogramm aus einem unerwarteten Grund abstürzt? (Stromausfall/Speicherproblem usw.).Was passiert, wenn das Treiberprogramm abstürzt?
Ich könnte mir vorstellen, dass Sie alle Arbeit verlieren werden, da der Code, der die Ergebnisse liest, nicht mehr läuft, oder weiß Spark irgendwie, wie man es neu startet? Wenn das so ist, wie?
Abhängig davon, wie Sie Ihren Treiber ausführen. Z. B., wenn Sie im Garn-Cluster-Modus laufen, wird Garn Ihren Fahrer erneut versuchen. Dies bedeutet jedoch, dass Sie alle Ihre Jobs erneut ausführen müssen. – zsxwing
Danke. Also muss ich es so entwerfen, dass der Treiber den Fortschritt von Teilberechnungen irgendwo speichert, und die "Phase" der Berechnung in irgendeinem Protokoll aktualisiert, und die Fehlertoleranz intern behandelt, denke ich –
Richtig. Sie müssen den Treiber selbst wiederherstellen. – zsxwing