2016-06-15 27 views
0

Hadoop 1.x hatte, so weit ich weiß, sekundären Namen, wurde aber verwendet, um ein Image des primären Namens zu erstellen, und es aktualisiert den primären Namen, wenn es fehlschlägt und erneut gestartet wird . Aber was nützt der sekundäre Nomenode in Hadoop 2.x, da wir bereits einen Hot-Standby-Modus haben?Verwendung von sekundären Namentypen in Hadoop in 2.x

Antwort

2

Soweit ich das Hadoop 2.x wissen kann auf 2 Arten erfolgen:

1. HA (High Availability Cluster): wenn Sie einrichten HA-Cluster, dann müssen Sie möglicherweise nicht auf Verwenden Sie Secondary nynode, da der Name des Standby-Namens seinen Status mit dem Namen des Active-Namens synchronisiert.

Die Funktion HDFS NameNode High Availability ermöglicht die Ausführung redundanter NameNodes im selben Cluster in einer Active/Passive-Konfiguration mit Hot Standby. Beide NameNode erfordern dieselbe Art von Hardwarekonfiguration. Im HA-Hadoop-Cluster Active NameNode liest und schreibt Metadateninformationen im separaten JournalNode.

Bei einem Failover stellt der Standby-NameNode sicher, dass der Namespace gemäß den Bearbeitungsprotokollen vollständig aktualisiert wird, bevor er in den aktiven Zustand wechselt. Daher ist in diesem Cluster-Setup kein sekundärer NameNode erforderlich.

2. Ohne HA: können Sie eine Hadoop-Konfiguration ohne Standby-Knoten haben. Dann verhält sich der sekundäre NameNode wie bereits in Hadoop 1.x beschrieben.

+0

Wenn Sie mehr über das Konfigurieren von HA wissen möchten, können Sie diesen Link sehen: http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.0. 8.0/bk_system-admin-guide/inhalt/ch_hadoop-ha-5.html –

0

Wenn Sie HA für NameNodes konfigurieren, wird der sekundäre Namenscode nicht verwendet. Sie können jedoch HDFS auch ohne HA (mit NameNode und Secondary NameNode) konfigurieren. Dieser Teil hat sich seit Hadoop 1.x nicht wesentlich verändert.