Ich versuche, die folgenden Informationen zu extrahieren:Wie kratze ich diese Squawka-Seite?
auf der Seite
http://epl.squawka.com/stoke-city-vs-arsenal/01-03-2014/english-barclays-premier-league/matches
Drücken der roten „vollständigen statistiken“ Taste öffnet ein Menü, das (auf der linken Seite) auf den Button enthält " Kreuze ". Dies öffnet, auf der rechten Seite des Bildschirms, ein Bild von einem Fußballfeld mit 19 Pfeilen darauf, das sind die Kreuzpässe von Stoke im Stoke-Arsenal-Spiel. Sie sind farbcodiert, rot = nicht abgeschlossen, grün = abgeschlossen, gelb = Taste passiert. Wenn Sie auf einen Pfeil klicken, wird Ihnen angezeigt, wer den Pass gegeben hat und in welcher Minute des Spiels. Die Pfeile zeigen auch, wo der Spieler stand, als er den Pass gab und wo der Spieler war, an den er weitergeleitet wurde.
Ich mag wäre in der Lage sein, um diese Seite zu kratzen, so dass ich eine Tabelle mit den Spalten erhalten:
Team; Name des Absenders; Senderort; Ort des Empfängers; Minute; Pfeil-Farbe
Dies ist die Menge der Cross-Pässe von Stoke gemacht, ich möchte dies auch automatisch für Arsenal wiederholen (daher die Spalte "Club" in der Tabelle oben).
Obwohl ich Webseiten in der Vergangenheit geschabt habe, waren diese alle statisch ziemlich gerade Seiten, und ich bin total verblüfft, wie man die Informationen von dieser Seite kratzt. Ich würde wirklich Hilfe schätzen, wie man die Daten kratzt, die ich gerade beschrieb. Ich bin sehr versiert in R, daher würde ich besonders den Code schätzen, der mir helfen würde, dies in R zu erreichen, aber ich bin auch sehr dankbar für Hilfe, die andere Sprache oder Software verwendet.
Danke, Peter
tun können, Sie werden wahrscheinlich einen Browser-Treiber verwenden müssen wie Selen. Es gibt R Schnittstellen; siehe http://lluisramon.github.io/relenium/ und http://johndharrison.github.io/RSelenium/. – Ista
Ich hatte noch nie von so etwas gehört, neue Hausaufgaben! Wie würde ich das verwenden, um eine Seite wie diese auf Squawka zu kratzen? Irgendwelche Hinweise? –
Es gibt ein schönes Beispiel dafür, wie man Selenium mit 'R' einfach [hier] (http://stackoverflow.com/a/22123344/1036500) verwendet, momentan eine Antwort auf die Frage direkt auf dem [R tag] (http://stackoverflow.com/questions/tagged/r) – Ben