Ich möchte eine Tabelle aus der citibike kratzen: https://s3.amazonaws.com/tripdata/index.htmlWie scrappe Javascript Tabelle in R?
Mein Ziel ist es auf einmal die URLs der Zip-Dateien zu bekommen, anstatt manuell alle Termine eingeben und zu jedem Zeitpunkt ein Download. Da die Webseite monatlich aktualisiert wird, möchte ich bei jeder Ausführung der Funktion alle aktuellen Datendateien abrufen können.
Ich habe zuerst versucht, Rvest und XML-Pakete zu verwenden und dann festgestellt, dass die Webseite sowohl die HTML und eine Tabelle enthält, die von einer JavaScript-Funktion generiert wird. Da war das Problem.
Ich freue mich über jede Hilfe und bitte lassen Sie mich wissen, wenn ich weitere Informationen zur Verfügung stellen könnte.
Möglicherweise müssen Sie [RSelenium] (https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-basics.html) verwenden. – r2evans