Ich hoffe, es geht Ihnen gut.So automatisieren Sie das Pyspark-Skript in Microsoft Azure
Ich bin neu bei Spark sowie Microsoft Azure. Gemäß unserer Projektanforderung haben wir ein Pyspark-Skript entwickelt, obwohl das Jupyter-Notebook in unserem HDInsight-Cluster installiert ist. Bis heute haben wir den Code vom Jupyter selbst ausgeführt, aber jetzt müssen wir das Skript automatisieren. Ich habe versucht, Azure Datafactory zu verwenden, konnte aber von dort aus keine Möglichkeit finden, das Pyspark-Skript auszuführen. Auch versucht, oozie zu verwenden, aber konnte nicht herausfinden, wie man es benutzt.
Mögen Sie mir bitte helfen, wie ich ein Pyspark-Skript in azurblau automatisieren/planen kann.
Danke, Shamik.
Danke Gaurav, werde ich versuchen, diesen Ansatz. Abgesehen von datafactory gibt es einen Weg, durch den wir in Azure HdInsight ein Pyspark-Prohram planen können? – Shamik
Ich habe versucht, mit dem Beispiel in der Verknüpfung erwähnt und festgestellt, dass 'style': 'StartOfInterval' erstellt eine Ausnahme, die besagt, dass ein Unterschied in den Verfügbarkeitseinstellungen in Ausgabe und Pipeline ist. Sobald ich dieses Attribut aus dem Pipeline-JSON entfernt habe, wurde es erfolgreich verteilt. Jetzt werde ich prüfen, ob es läuft oder nicht. – Shamik
Der oben erwähnte Link ist momentan nicht verfügbar. – Arron