2016-07-12 88 views
0

Ich möchte eine Anwendung erstellen, die verschiedene Websites crawlen und MP3-URLs auf der Grundlage der angegebenen Abfrage sammeln kann.Crawler zum Speichern von MP3-URLs in asp.net mvc Webanwendung

Benutzer kann Liedtitel suchen, wenn Ergebnisse in der Datenbank verfügbar sind, dann verwandten Lied URL sonst crawlweb site zeigen und zusammengehendes Ergebnis finden, das in der Datenbank gespeichert wird und results zum Benutzer zeigt.

Antwort

3

Ich würde geben HtmlAgilityPack ein Go (Sie können mit Paket-Manager installieren).

Ein einfaches Beispiel dafür, wie zu starten:

string url = "http://www.google.com"; 
HtmlWeb web = new HtmlWeb(); 
HtmlDocument doc = web.Load(url); 

Wenn Sie ein Dokument geladen haben, können Sie es überprüfen können:

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//a[@href]")) 
{ 
    if (node.Attributes.Contains("href")) 
    { 
     Console.WriteLine(node.Attributes["href"].Value); 
    } 
} 

Der vor allem die URLs gedruckt werden soll für die finden Anker.

+0

ich tring, doc.DocumentNode.SelectNodes ("// a [@ data-href]") zu verwenden, aber es funktioniert nicht. –

+0

Hmm, wie wäre es auf diese Weise versuchen: doc.DocumentNode.SelectNodes ("// a") Und dann verwenden Sie einfach: if (node.Attributes.Contains ("data-href")) { Console .WriteLine (node.Attributes ["Daten-href"]. Value); } – eyesuc