Können wir für hadoop 2.0 ein Architektur-Setup haben, bei dem sich alle Namensknoten in einem Cluster und alle Datenknoten in einem anderen Cluster befinden?Können wir Namensknoten in einem Cluster und Datenknoten in einem anderen Cluster haben?
Antwort
Ja. Es ist möglich.
Siehe HDFS Federation Artikel von Apache Website.
Multiple Namenodes/Namespaces
Um horizontal den Namensdienst zu skalieren, verwendet Verband mehrere unabhängige Namenodes/Namensräume. Die Namenodes sind eingebunden; Die Namenodes sind unabhängig und erfordern keine Koordination untereinander.
Die Datanodes als gemeinsamer Speicher für Blöcke, die durch die ganze Namenodes verwendet.
Jeder Datanode registriert sich bei allen Namenoden im Cluster. Datanodes senden periodische Heartbeats und blockieren Berichte. Sie behandeln auch Befehle von den Namenodes.
Dies ist die Föderation, wo NameNodes unabhängig voneinander sind und DataNodes an alle NameNodes berichten. Was das OP gefragt hat, ist ein Cluster von NameNodes (oder möglicherweise HA NameNodes) und ein Cluster von DataNodes. – alvits
Selbst wenn es möglich ist, macht es auch Sinn macht separate Cluster zu haben? Funktionieren die NameNodes weiterhin ohne DataNodes? Arbeiten DataNodes noch ohne NameNodes? – alvits