Ich habe URL wie:
http://www.matweb.com/search/DataSheet.aspx?MatGUID=849e2916ab1541be9ff6a17b78f95c82matweb.com: Wie bekomme ich die Quelle der Seite?
Ich möchte von dieser Seite Quellcode herunterladen mit diesem Code:
private static string urlTemplate = @"http://www.matweb.com/search/DataSheet.aspx?MatGUID=";
static string GetSource(string guid)
{
try
{
Uri url = new Uri(urlTemplate + guid);
HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(url);
webRequest.Method = "GET";
HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse();
Stream responseStream = webResponse.GetResponseStream();
StreamReader responseStreamReader = new StreamReader(responseStream);
String result = responseStreamReader.ReadToEnd();
return result;
}
catch (Exception ex)
{
return null;
}
}
Wenn ich so bekomme ich:
Sie dies nicht tun scheinen Cookies aktiviert zu haben. MatWeb Erfordert die Aktivierung von Cookies.
Ok, das verstehe ich, so habe ich Linien:
CookieContainer cc = new CookieContainer();
webRequest.CookieContainer = cc;
Ich habe:
Ihre IP Adresse ist aufgrund übermäßigen Gebrauch beschränkt. Das Problem kann sich verschärfen, wenn eine IP-Adresse von vielen Personen in einem Unternehmen oder über einen Internetdienstanbieter geteilt wird. Wir bitten um Entschuldigung für die Unannehmlichkeiten.
Ich kann das verstehen, aber ich bekomme diese Nachricht nicht, wenn ich versuche, diese Seite mit einem Webbrowser zu besuchen. Was kann ich tun, um den Quellcode zu bekommen? Einige Cookies oder http-Header?
Oh danke! Das funktioniert :). Wie kann ich meinen eigenen UserAgent bekommen? –
Um den UserAgent zu erhalten, den Ihr Browser sendet, versuchen Sie etwas wie diese Seite: http://whatsmyuseragent.com/ –