Ich habe eine Webseite „http://www.jabong.com/playdate-Off-White-Casual-Top-1342500.html?pos=1“ und ich bin in der Lage den HTML-Code, es zu bekommen ... aber ich brauche bestimmte Informationen ... aus der oben genannten Seite zu extrahieren:Eine bestimmte Information aus einem HTML-Code einer Webseite extrahieren? Ich müsste die folgenden Informationen
Typ : Casual Tops, Stoff: Baumwolle, Ärmel: Halbarm, Ausschnitt: Rundhalsausschnitt, Passform: Regular, Waschpflege: Handwäsche, Schonende Waschmittel verwenden, Gürtel/Broschen vor dem Waschen entfernen, Farbe: Cremefarben, Stoffdetails: 95/5 BaumwolleLycra, Stil: Grafik, SKU: PL527KA99JYQINDFAS
Sie benötigen ein Web-Scraping-Paket wie [rvest] (https://github.com/hadley/rvest). – alistaire
@alistaire: Du hast die Frage nicht richtig verstanden. Ich kann den kompletten HTML-Code lesen ... Ich muss nur bestimmte Informationen extrahieren ... also denke ich, dass das Stringr-Paket helfen wird ... aber ich brauche einen Code, der das extrahieren kann insbesondere info..danke –
'rvest' kann kratzen, ja, aber die meisten Scraping ist Parsing, was Sie tun müssen. Parsen Sie HTML nicht mit Regex; Es ist eine schlechte Idee. – alistaire