Ich lerne Scrapy, ein Web-Crawling-Framework.Wie Scrapy zeigen Benutzer Agent pro Download-Anfrage im Protokoll?
Ich weiß, ich kann USER_AGENT
in Datei des Scrapy-Projekts festlegen. Wenn ich den Scrapy starte, kann ich den USER_AGENT
Wert in INFO
Protokollen sehen.
Diese USER_AGENT
wird in jeder Download-Anfrage auf den Server gesetzt, den ich crawlen möchte.
Aber ich benutze mehrere USER_AGENT
zufällig mit Hilfe von this solution. Ich denke, dass diese zufällig gewählte USER_AGENT
funktionieren würde. Ich möchte es bestätigen. Also, wie kann ich machen Scrapy zeigtUSER_AGENT
pro Download-Anfrage, damit ich den Wert von USER_AGENT
in den Protokollen sehen kann?
Aber warum hat es PyPI nicht hinzugefügt? – theotheo
@theotheo getan, siehe https://pypi.python.org/pypi/scrapypy-fake-useragent. Danke für die Idee. – alecxe
@alecxe Ich benutze Fake-useragent in meinem Projekt, aber es wirft "Raise FakeUserAgentError ('Fehler beim Browser") # noqa FakeUserAgentError: Fehler beim Browser "Fehler aufgetreten. – javed