Ich habe eine URL:wie Website kratzen, in den Seiten-URL nicht geändert wird, aber die nächste Taste unter der gleichen URL-Seite Daten hinzufügen
http://www.goudengids.be/qn/business/advanced/where/Provincie%20Antwerpen/what/restaurant
Auf dieser Seite gibt es eine „nächste Ergebnisse“ -Taste, die laden weitere 20 Datenpunkte, während immer noch der erste Datensatz angezeigt wird, ohne die URL zu aktualisieren. Ich schrieb ein Skript, um diese Seite in Python zu scrappen, aber es kratzt nur die ersten 22 Datenpunkte, obwohl die Schaltfläche "nächste Ergebnisse" angeklickt wird und ungefähr 40 Daten anzeigt.
Wie kann ich diese Art von Website kratzen, die dynamisch
Mein Skript Inhalt laden ist
import csv
import requests
from bs4 import BeautifulSoup
url = "http://www.goudengids.be/qn/business/advanced/where/Provincie%20Antwerpen/what/restaurant/"
r = requests.get(url)
r.content
soup = BeautifulSoup(r.content)
print (soup.prettify())
g_data2 = soup.find_all("a", {"class": "heading"})
for item in g_data2:
try:
name = item.text
print name
except IndexError:
name = ''
print "No Name found!"
, als ich das Skript lief es gab mir eine Fehlermeldung Traceback (jüngste Aufforderung zuletzt): Datei "C: \ Benutzer \ Benutzer \ Desktop \ Python \ script \ 3url.py", Zeile 3, in mit requests.Session() als Sitzung: NameError: Name 'Anfragen' ist nicht definiert Wie kann ich es beheben ?? –
vishnu
@vishnu se diese 'import requests' Zeile oben? Das ist wichtig. Und Sie müssen 'Requests' Modul installiert haben. – alecxe
ya du bist richtig @alecxe Ich habe es wirklich vergessen. Danke für Ihre große Hilfe und auch ich brauche Sie in Zukunft – vishnu