Gibt es im Befehl bin/nutch solrindex
einen Parameter, der angibt, auf welchen Solr-Kern indexiert werden soll?Verwenden von Nutch solrindex zum Indexieren auf mehrere Kerne?
6
A
Antwort
8
Mir sind keine Kernparameter bekannt. Sie sollten nur den Namen des Kerns in Ihrem solr url Parameter wie folgt einfügen: http://localhost:8983/solr/core0
.
0
In nutch 1.4, ist das, was ich zu indizieren, um verschiedene Kerne verwenden:
bin/nutch kriechen Urls/url1 -solr http://localhost:8983/solr/core1 -depth 10 -topN 10000
die jetzt durchaus Sinn macht. – Ramsel
Dies funktioniert definitiv, lassen Sie sich nicht davon abschrecken, dass Sie beim Zugriff auf http: // localhost: 8983/solr/core_name ein 404 sehen, das ist der Weg, einen spezifischen Solr-Core für Ihre Apache Nutch Spider zu wählen. ..thanks – Carlton
fügen Sie einfach/admin hinzu, um 404 zu vermeiden. Nutch verwendet die Auswahl- und Aktualisierungs-Request-Handler und fügt ihren Pfad zur konfigurierten Solr-Core-URL hinzu. – javanna