Ich möchte die Informationen über die Bewertung von Zimmer (Genauigkeit, Kommunikation, Sauberkeit, Lage, Check In, Wert) zu extrahieren.Web-Scraping mit R. Extracting Rating-Marken von Web-Seite
url <- "https://www.airbnb.com/rooms/8400275"
con <- file (url)
raw <- readLines (con)
close (con)
und jetzt brauche ich eine Zeichenfolge, die mir helfen wird, die Informationen zu extrahieren. Im Quellcode fand ich eine solche Zeile:
data-reactid=".1tzzodvxlvk.1.0.0.0.0.0.3.0.0.1.0"><div class="col-lg-6"
data-reactid=".1tzzodvxlvk.1.0.0.0.0.0.3.0.0.1.0.$col-0"><div data
reactid=".1tzzodvxlvk.1.0.0.0.0.0.3.0.0.1.0.$col-0.$Accuracy"><div
class="pull-right" data
reactid=".1tzzodvxlvk.1.0.0.0.0.0.3.0.0.1.0.$col-0.$Accuracy.0"><div
class="star-rating-wrapper" data
reactid=".1tzzodvxlvk.1.0.0.0.0.0.3.0.0.1.0.$col-0.$Accuracy.0.0">
class="star-rating" content="4.5"
Wie ich verstanden, das ist der Code von „Genauigkeit“ Bewertung des Raumes. Ich möchte "The content = '4.5'" und den Namen der Schätzung "Accuracy" extrahieren. Wie kann ich das tun? Das Problem ist, dass es im Quellcode viele solcher "Content =" - und "Accuracy" -Strings gibt.
Funktioniert gut, danke :) – YNWA1992