So habe ich eine Liste von Unterreddits und ich benutze Urllib, um sie zu öffnen. Als ich durch sie gehen schließlich nicht urllib mit:urllib2 HTTP-Fehler 429
urllib2.HTTPError: HTTP Error 429: Unknown
einige der Forschung fand ich, dass reddit die ammount von Anfragen an die Server von IP begrenzt:
nicht mehr Stellen als eine Anforderung alle zwei Sekunden . Es gibt einige Freiheiten für Anfragen, aber behalten Sie es gesund. Im Allgemeinen sollten Sie nicht mehr als 30 Anfragen in einer Minute einhalten.
Also dachte ich, ich würde time.sleep()
verwenden, um meine Anfragen auf eine Seite alle 10 Sekunden zu begrenzen. Dies endet genauso gut.
Das obige Zitat stammt von der reddit API Seite. Ich benutze nicht die reddit API. An diesem Punkt denke ich zwei Dinge. Entweder gilt dieses Limit nur für die reddit-API oder urlib hat auch eine Beschränkung.
Weiß jemand, welches dieser beiden Dinge es ist? Oder wie könnte ich dieses Problem umgehen?
Es gibt keine Begrenzung in 'urllib2', wie Sie durch das Testen einer anderen Webseite herausgefunden haben könnten. Möglicherweise haben sie Ihre IP-Adresse vom API-Zugriff blockiert. Senden Sie ihnen eine E-Mail. –
@larsmans Die Requests durchlaufen zufällig. Ich bekomme ein paar, dann scheitert es eine Weile und dann funktioniert es wieder. Außerdem konnten sie mich nicht von ihrer API blockieren, da ich ihre API nicht verwende. –