2013-03-31 9 views
5

Hier ist das Projekt offiziell „Dokumentation“:Wie ScrapySharp verwendet wird, um Elemente in einem HTML-Dokument zu analysieren?

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


Egal, was ich versuche, ich kann die CssSelect() Methode nicht finden, dass die Bibliothek soll hinzuzufügen abfragt Dinge einfacher zu machen. Hier ist, was ich versucht habe:

using ScrapySharp.Core; 
using ScrapySharp.Html.Parsing; 
using HtmlAgilityPack; 

HtmlWeb web = new HtmlWeb(); 
HtmlDocument doc = web.Load("http://www.stackoverflow.com"); 

var page = doc.DocumentNode.SelectSingleNode("//body"); 
page.CssSel??? 

Genau wie verwende ich diese Bibliothek? In der Dokumentation ist nicht klar, welcher Typ html ist.

+2

Ich habe das Projekt nur Wiki aktualisiert. https://bitbucket.org/rflechner/scrapysharp/wiki/Home Ich hoffe, es wird einfacher zu bedienen sein. Tschüss – rflechner

Antwort

7

using ScrapySharp.Extensions; 

Es hinzufügen wie du, dass du fehlt aussieht. Das sollte CssSelect zur Verfügung stellen.

Nur für den Fall eines Beispiel hilft, ist hier ein Verfahren, als auch, dass ich in einem Projekt verwenden:

private string GetPdfUrl(HtmlDocument document, string baseUrl) 
{ 
    return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString(); 
}