MRJob wartet, bis jeder Auftrag abgeschlossen ist, bevor dem Benutzer die Steuerung zurückgegeben wird. Ich habe einen großen EMR-Schritt in kleinere zerlegt und möchte sie alle auf einmal einreichen.Übergeben von Aufträgen an den EMR-Cluster mit MRJob
Die Dokumente sprechen über programmatically submitting tasks, aber der Beispielcode wartet auch auf den Abschluss des Auftrags (seit sie den Befehl runner.run() aufrufen, der blocks until the job is complete).
Auch EMR hat eine Beschränkung von 256 aktiven Jobs, aber wie gehen wir über das Auffüllen dieser 256 Jobs statt Schleifen und erhalten die Ausgabe auf der angeschlossenen Konsole.