Ich versuche, eine Website zu scrappen, aber mein Code funktioniert nur, wenn ich die Website geöffnet habe und dann aktualisieren. Ich habe mehrere Dinge ausprobiert und halten die beiden folgenden Fehler kommen: Die erste: Valueerror: „httperror: HTTP-Fehler 416: Angeforderte Bereich nicht erfüllbar“Python Scrape urllib2 HTTP-Fehler
urlslist = open("list_urls.txt").read()
urlslist = urlslist.split("\n")
for urlslist in urlslist:
htmltext = urllib2.urlopen("www..."+ urlslist)
data = json.load(htmltext)
Ich habe auch versucht, einige Header verwenden und solche, sondern bekommen der Fehler 'ValueError: Kein JSON-Objekt konnte decodiert werden':
req = urllib2.Request('https://www....)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.1)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36')
htmltext = urllib2.urlopen(req)
data = json.load(htmltext)
Ich bin ratlos, jede Hilfe?
Warum "www ..."? Ist das dein Code? –
Bitte lesen Sie http://stackoverflow.com/help/mcve. – boardrider
die URL ist: http://www.stubhub.com/beyonce-tickets-beyonc--san-diego-qualcomm-stadion-5-12-2016/event/9519801/ – sky44