Ich habe ein Scrapy-Projekt mit mehreren Spinnen erstellt, um einige Websites zu crawlen. Jetzt möchte ich TOR zu verwenden:Scrapy mit TOR (Windows)
- Verstecke meine IP von den gecrawlt Servern;
- Verknüpfen Sie meine Anforderungen zu verschiedenen ips, simulieren Zugriffe von verschiedenen Benutzern.
Ich habe einige Informationen darüber, zum Beispiel lesen: using tor with scrapy framework, How to connect to https site with Scrapy via Polipo over TOR?
Die Antworten von diesen Links mir nicht geholfen waren. Welche Schritte muss ich unternehmen, damit Scrapy mit TOR richtig funktioniert?
EDIT 1:
Antwort Anbetracht 1, begann ich TOR durch die Installation. Während ich Windows verwende, habe ich das TOR Expert Bundle (https://www.torproject.org/dist/torbrowser/5.0.1/tor-win32-0.2.6.10.zip) heruntergeladen und das Kapitel über die Konfiguration von TOR als Relais gelesen (https://www.torproject.org/docs/tor-doc-windows.html.en). Leider gibt es wenig oder keine Informationen darüber, wie man es unter Windows macht. Wenn ich das heruntergeladene Archiv entpacken und die Datei Tor \ Tor.exe ausführen, passiert nichts. Ich kann jedoch im Task-Manager sehen, dass ein neuer Prozess instanziiert wird. Ich weiß nicht, wie ich von hier aus am besten vorgehen soll.
Was haben Sie bereits erreicht? Was ist dein Problem? Bitte bearbeiten Sie Ihre Frage und erklären Sie uns diese, damit wir Ihnen helfen können. – GHajba
Dieses Scrapy-Projekt auf Github erklärt, wie anonym Anonymously: https://github.com/WiliTest/Anonymous-scrapping-Srapy-Tor-Privoxy-UserAgent –