Ich habe eine Nutch-Crawl-Aufgabe, die einen ganzen Tag lang läuft, bis ich den Prozess durch einen Fehler beendet habe.Gibt es eine Möglichkeit, die Aufgabe "Nutch Crawl" fortzusetzen, die unerwartet beendet wurde?
Ich möchte nicht die Samen neu crawlen (kostet zu viel Zeit), also frage ich mich, ob es einen Weg oder einige Nutch Crawler-Parameter gibt, kann der Crawler diese URLs ignorieren, die bereits gecrawlt wurde.
Vielen Dank!