Ich möchte Big Data Analytics für meine Arbeit verwenden. Ich habe bereits alle Docker-Sachen implementiert, die Container in Containern erstellen. Ich bin jedoch neu in Big Data und ich habe erfahren, dass die Verwendung von Hadoop für HDFS und die Verwendung von Spark anstelle von MapReduce auf Hadoop selbst der beste Weg für Websites und Anwendungen ist, wenn es auf Geschwindigkeit ankommt (oder?). Funktioniert das auf meinen Docker-Containern? Es wäre sehr hilfreich, wenn mich jemand irgendwohin leiten könnte, um mehr zu lernen.Verwenden von Hadoop und Spark auf Docker-Containern
2
A
Antwort
3
Sie können versuchen, mit Cloudera QuickStart Docker Image zu spielen, um loszulegen. Bitte werfen Sie einen Blick auf https://hub.docker.com/r/cloudera/quickstart/. Dieses Docker-Image unterstützt die Bereitstellung von Clouderas Hadoop-Plattform und Cloudera Manager in einem einzelnen Knoten. Auch dieses Docker-Bild unterstützt Funken.
Web-Anwendungen in Hadoop/Funken? Entschuldigung, aber ich verstehe deine Frage nicht. Vielleicht verwechselst du apache spark bigdata (http://spark.apache.org/) und java web framework (http://sparkjava.com)? – angelcervera
Es tut mir leid, aber IMO diese Frage ist überall, es deckt mehrere Themen wie Analytics/Big Data (was auch immer das ist), Docker, Hadoop/HDFS, Spark und MapReduce. Wenn es darum geht, "wird dies auf meinen Docker-Containern funktionieren", würde ich sagen, ja, die meisten Dinge lassen sich auf Docker anwenden. – NikoNyrh