Ich schrieb vor kurzem einen einfachen Schaber mit Anfragen und BeautifulSoup. Der Scraper funktionierte einwandfrei bis zu einem Tag, ich lief es und erhielt eine "Verbindung zurückgesetzt von Peer, Error 54". Obwohl es mehrere Fragen gibt, wie man Fehler 54 umgehen kann, frage ich mich nicht.Ich glaube mein Scraper wurde blockiert, aber ich kann über einen normalen Browser auf die Website zugreifen, wie können sie das tun?
Um zu testen, ob die blockierte meine spezifische IP oder Computer, ich habe den Code auf einem anderen Computer und IP-Adresse und es hat gut funktioniert. Die beunruhigende Sache ist jedoch, dass ich selbst auf meinem alten Rechner die Seite in einem normalen Browser einwandfrei aufrufen kann.
Ich frage mich beide, wie die Website konnte dies tun, ohne meine IP direkt zu blockieren und wenn jemand irgendwelche Tipps hat, um dies in Zukunft zu vermeiden.
Ich stimme für das Schließen dieser Frage als Off-Topic ab, da diese Website für bestimmte Programmierfragen keine Tipps zum Arbeiten mit Netzwerksicherheitsmaßnahmen und/oder zum Festschreiben von nicht autorisierten Netzwerk-Scans bietet. –
Was ist die Website? Hast du ihre Tos gelesen? –
https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=scraping%20without%20getting%20blocked – MatthewMartin