2015-05-05 12 views
10

Ich benutze Nutch 2.3. Alle Jobs laufen nacheinander, d. H. Erster Generator, Fetch, Parse, Index usw. Ich möchte einige Jobs gleichzeitig ausführen. Ich weiß, dass einige Jobs nicht parallel ausgeführt werden können, aber andere können z. B. job, dbupdate, indexjob mit fetch ausgeführt werden.Wie Apache Nutch verschiedene Jobs parallel laufen

Ist es möglich? Mein grundlegendes Ziel ist es, den Fänger-Job die ganze Zeit zu erledigen. Ich nehme an, dass wir es mit einem anderen Zeitstempel machen können. Kann mir jemand den richtigen Weg zeigen?

+0

Kannst du shadoop mit nutch benutzen? –

Antwort

5

Wenn Sie den nutch Web-App-Server auschecken, werden Sie feststellen, dass er mehrere Crawl-Jobs parallel ausführen kann. Sie sollten den Quellcode von Nutch 2.3 für webapp [NutchUiServer] lesen. Hoffe das hilft.