Ich folge diesem Leitfaden http://doc.scrapy.org/en/0.16/topics/practices.html#run-scrapy-from-a-script Scrapy von meinem Skript ausführen. Hier ist ein Teil meiner Skript:Scrapy Crawl von Skript blockiert immer Skriptausführung nach dem Scrapen
crawler = Crawler(Settings(settings))
crawler.configure()
spider = crawler.spiders.create(spider_name)
crawler.crawl(spider)
crawler.start()
log.start()
reactor.run()
print "It can't be printed out!"
Es funktioniert es soll: Besuche Seiten, kratzen benötigte Informationen und speichert Ausgabe json, wo ich ihm gesagt (via FEED_URI). Aber wenn Spinne seine Arbeit beendet (ich kann es durch Nummer in Ausgabe json sehen) würde die Ausführung meines Skripts nicht fortgesetzt. Wahrscheinlich ist es nicht scrapy Problem. Und Antwort sollte irgendwo im verdrehten Reaktor sein. Wie kann ich die Thread-Ausführung freigeben?
Wrap diesen Code in einem neuen Skript und nennen das vielleicht? – Talvalin
Ich bin mir nicht sicher, ob ich Ihren Kommentar richtig verstanden habe. Was meinst du "Call the Script"? Es hängt direkt in reactor.run() und log schreibt mir: "INFO: Closing Spinne (fertig)" so Spinne scheint fertig zu sein. –