Ich muss eine Webseite kratzen, die eine javascript-gerenderte AngularJS-App ist. Die Entwickler der Website erkennen Safari/Firefox im privaten Browser-Modus und verbieten die Verwendung und somit das Scrapen. Die Seite funktioniert mit Safari/Firefox, wenn Sie sich nicht im privaten Modus befinden.Kann Can Scrapy mit dem Chrome Browser verwendet werden?
Das Interessante ist, dass keine solche Warnung gegeben wird, wenn Sie Chrome im privaten Modus verwenden oder nicht. Ich benutzte Scrapy + Selenium, aber ich hoffte wirklich, ScrapyJS/Splash für dieses Projekt zu verwenden. Es sieht jedoch so aus, als ob die Scrapy/Splash-Kombination an der privaten Browser-Wand der Website leidet.
Ist es möglich, Scrapy zu sagen, Chrome zu verwenden? Ich weiß, Selen hat ziemlich viele Treiber, und es ist ziemlich gut dokumentiert, wie man sie benutzt, aber ich kann keine Informationen darüber finden, ob Scrapy andere Browser unterstützt oder ob jemand anderes dies bereits getan hat. Google/SO-Suchanfragen haben dies auch für mich nicht beleuchtet.
Haben Sie versucht, den User Agent zu ändern? http://stackoverflow.com/questions/18920930/scrap-ypython-setup-user-agent –
Ja, ich habe dies in der Scrapy 'settings.py' Datei versucht und es schien keinen Effekt zu haben. Ich habe ein paar bekannte Chrome/Firefox/Safari-Agenten sowie einige "Scrapy be a good citizen" -Benutzer ausprobiert. – Randy
Haben Sie versucht, selen 'chrome driver' zu verwenden? – Rahul