Ich bin Student und Informatik zu tun. Als Teil meiner Forschung arbeite ich an der Hadoop-Umgebung. Die Person, die an dieser Forschung vor mir gearbeitet hat, hat 9 Datanode mit einem Namen-Knoten und einem Standby-Knoten konfiguriert. Wir haben unsere Netzwerkverkehrsdaten in der Struktur gespeichert und entwickle Strukturabfragen, um Netzwerkangriffe zu identifizieren. Die Person, die daran gearbeitet hat, ist schon von zu Hause weggegangen und arbeitet woanders und beschäftigt. So habe ich ein paar Fragen:Hadoop Umgebung ist Down
1) Wie kann ich die Architektur auf HDFS meiner Umgebung, d. h. wie die Maschinen verbunden sind, um diese Umgebung zu bauen. Welche Dienste für diese Umgebung sind auf welchen Rechnern installiert?
2) Jetzt haben wir 9 Daten in der Umgebung und mein Professor will die Daten reduzieren. Ihr Ziel ist es, in dieser Umgebung mit 2-3 (minimalen) Maschinen zu forschen.
3) Was ist die gute und einfache Quelle, um Verständnis über die Cloudera und Hadoop zu bekommen? Auch die Befehle, mit denen ein Dienst explizit gestartet und gestoppt werden kann.
4) Im Moment bin ich in cloudera manager nicht in der Lage, den Nameode Server, Secondary Datanode und einen weiteren zu starten. Ich stoppe alle Dienste in der Reihenfolge von Cloudera und jetzt in der Reihenfolge und in dieser Reihenfolge der HDFS-Dienst beginnt zuerst, so während es startet, gibt es die Fehlermeldung für Namenknoten Datenknoten und Datenknoten8.
habe ich versucht, mehrere Möglichkeiten, aber kein Glück. Bitte schlage mir ein paar Wege vor, wie ich Probleme lösen kann und gute Ressourcen (für Anfänger), ich kann mich darauf beziehen, mehr darüber zu erfahren.
Danke.
Dies ist wirklich off-topic für StackOverflow - Sie fragen grundsätzlich nach einem How-to/Tutorial. –
richtig, aber Sie können auf Frage 4), und ich brauche Hilfe auf dem .. – DharaPPatel
Großartig - dann sollten Sie eine bestimmte Frage über Cloudera Manager stellen und Details/Screenshots der Fehler, die Sie bekommen. –