Ich möchte alle Titel() auf der Website zu bekommen.Scraping 'N' Seiten mit Beautifulsoup und Anfragen (So erhalten Sie die wahre Seitenzahl)
http://www.shyan.gov.cn/zwhd/web/webindex.action
Jetzt scrappt mein Code erfolgreich nur eine Seite. Es gibt jedoch mehrere Seiten auf der oben genannten Website, in denen ich gerne kratzen würde.
Zum Beispiel, mit der obigen URL, wenn ich den Link zu "Seite 2" klicken, ändert sich die allgemeine URL nicht. Ich schaute auf die Seitenquelle und sah JavaScript-Code, um auf die nächste Seite wie folgt voranzuschreiten: javascript: gotopage (2) oder javascript: void (0). Mein Code ist hier (get Seite 1)
from bs4 import Beautifulsoup
import requests
url = 'http://www.shyan.gov.cn/zwhd/web/webindex.action'
r = requests.get(url)
soup = Beautifulsoup(r.content,'lxml')
titles = soup.select('td.tit3 > a')
for title in titles:
print(title.get_text())
Wie kann mein Code geändert werden Titel aus allen verfügbaren aufgelisteten Seiten zu kratzen? Vielen Dank!
Vielen Dank! Aber ich kann nicht die nächste Seite entweder.My Code ist unten.Bitte helfen Sie mir, es zu ändern. –