2015-10-23 15 views
8

Was ist der Unterschied zwischen Oozie Workflow, Koordinator und Bundle?Was ist der Unterschied zwischen Oozie Workflow, Koordinator und Bundle?

Der Oozie-Workflow definiert eine Abfolge von Aktionen. Und wir müssen es jedes Mal manuell aufrufen, wenn wir es ausführen wollen. Wo derselbe Workflow über den Koordinator geplant werden kann. Ist dieses Verständnis korrekt?

Dann was ist extra im Bundle?

Ich denke, es wird wieder verwendet, um einen Satz von Koordinatoren zu planen. Warum kann dann nicht ein Koordinator verwendet werden, um einen anderen Koordinator zu planen, wie ein Workflow einen anderen Sub-Workflow haben kann?

+2

Wenn Koordinator Eins ist um 7 Uhr geplant & Koordinator zwei ist um 10 Uhr geplant Wenn wir diese 2 zusammen bündeln 1) Müssen wir auch Bundle planen? 2) Wenn Koordinator One nach 10:00 Uhr fehlschlägt oder verzögert wird, wird Bundle die Ausführung von Koordinator 2 stoppen? Kannst du das bitte klären. – chandra

Antwort

5

Workflow:

Es ist eine Folge von Aktionen. Es wird in XML geschrieben und die Aktionen können reduzieren werden Karte, bienenstock, Schwein usw.

Koordinator:

Es ist ein Programm, das Aktionen (im allgemeinen Workflow-Jobs) auslöst, wenn eine Reihe von Bedingungen erfüllt sind. Bedingungen können eine Zeit-Frequenz, andere externe Ereignisse usw.

Bundle sein:

Es ist, als eine höhere Ebene Oozie Abstraktion definiert ist, die einen Satz von Koordinator jobs.We Chargen kann die Zeit für das Bündel Job angeben fang auch an.

+0

danke für die antwort. Aber diese Definitionen verdeutlichen immer noch nicht den Unterschied zwischen Bundle und Coordinator. –

+0

Nur ein höheres Maß an Abstraktion ... Gruppe von Workflows Koordinator ... Gruppe von Koordinatoren Bundle .... – madhu

1

Der Workflow verfügt nicht über Zeitangaben, um einen Hadoop-Job auszuführen. Koordinator Job haben die Zeitangaben über Job in coordinator.xml mit Frequenz-Tag. Collective Coordinator-Jobs werden als Bündeljob betrachtet. Im Bundle-Job können einzelne Benutzer ihre eigenen Jobs mithilfe ihrer job.properties für ihre jeweiligen Jobs zuweisen.

0

Für mein Verständnis, mit Bündel könnte Gruppe ein paar Koordinatoren, so dass es zu Manager besser sein wird, zu sehen, starten/stoppen ...

Wahrscheinlich haben wir zwei Datenpipeline, ist eine für log Übergeben (Sammeln/Analysieren/ETL), ist man für Geschäftslogik.

Dann erstelle ich zwei Bündel zu Gruppen die verschiedenen Arten von Koordinatoren.