Dieses Stück Code ruft den Inhalt einer Seite von Google Movies:Verschiedene Crawling Verhalten auf Ubuntu und Windows
import urllib2
f = urllib2.urlopen("https://www.google.com/movies?hl=fr&tid=4f451a87a71bfa51&date=0")
print(f.read())
es richtig, die Filme in diesem Theater geplant enthält, wenn ich das Skript auf meinem Windows-PC laufen. Aber ich habe versucht, das Skript auf 3 verschiedenen Ubuntu-Servern auszuführen, und jedes Mal, wenn der Inhalt zurückgegeben wird, ist eine wohlgeformte Seite, auf der steht, dass momentan keine Filme geplant sind.
Wissen Sie, was diesen Unterschied im Verhalten von nur 3 Codezeilen verursachen kann? Ich habe auch versucht urllib.urlopen und die Ausgabe ist die gleiche.
Interessant! Wie hat es meinen Standort bestimmt, basiert es nur auf dem IP? Gibt es eine Problemumgehung, die getan werden kann, um das Skript funktionieren zu lassen, wie das Vortäuschen der IP oder des Standorts? – Arnaud
@Arnaud Es ist höchstwahrscheinlich IP-basierte Geolocation. Sie können Ihre IP mit einem VPN oder einem Proxy "fälschen". Eine Google-Suche nach diesen Begriffen sollte Sie in die richtige Richtung lenken. – DeepSpace