Ich möchte ein bestimmtes Forum in Echtzeit crawlen und die Daten in HDFS ablegen, wenn nicht Hbase.storm crawler - Technologie-Stack und Apache Nutch
Ich hörte, Apache Nutch könnte den Zweck lösen, aber leider ist der Technologie-Stack ziemlich alt. Ich möchte den Hadoop nicht von 2.6 auf frühere Version und Elasticsearch auf 1.7/1.4 herabstufen, daher verlagerte ich meinen Fokus auf Storm-Crawler.
Da ich Hadoop 2.6, Elasticsearch 2.0 und Hbase 1.1.3 verwende, kann mir jemand sagen, ob Storm-Crawler 0.9 zusammen mit ihnen verwendet werden kann?
Warum nicht das Tag 'stormcrawler' zu dieser Frage hinzufügen? –
Hier ist kein Tag von 'stormcrawler'. Ich denke, es hat noch nicht 1500 Reputationen. – Gagan