Ich habe es mit einem Problem zu tun: Ich möchte eine Datenvisualisierung & Vorhersage-Infrastruktur machen.Big Data Architektur: Elasticsearch-Kibana mit Hive oder Hadoop
Ich dachte über Kibana + Elasticsearch auf Hdfs (mit ES-Hadoop), & Spark (Python) auf Hdfs für die Modellierung.
Meine Frage ist: kann ich Daten in Hdfs mit ES richtig indizieren, oder sollte ich Hive oder Spark zwischen Elasticsearch & Hdfs verwenden?
Ich weiß nicht, welche Architektur der beste Weg ist.
Ich weiß nicht, ob meine Frage explizit war ... Ich meine, ist es gut, Daten direkt auf HDFS zu indizieren oder ist es vorzuziehen, Daten mit Hive zu indizieren? –