Ich möchte den HTML-Quellcode einer Website herunterladen, um einige Informationen zu analysieren. Wie erreiche ich das in Java?Gibt es in Java etwas Ähnliches wie WebClient.DownloadString?
5
A
Antwort
8
Fügen Sie einfach einen BufferedReader (oder irgendetwas, das Strings liest) von einem InputStream einer URL an, der von openStream() zurückgegeben wurde.
public static void main(String[] args)
throws IOException
{
URL url = new URL("http://stackoverflow.com/");
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
String s = null;
while ((s = reader.readLine()) != null)
System.out.println(s);
}
0
können Sie die Java-Klassen direkt verwenden:
URL url = new URL("http://www.example.com");
URLConnection conn = url.openConnection();
InputStream in = conn.getInputStream();
...
aber es ist mehr empfohlen Apache HttpClient als Httpclient zu verwenden, wird eine Menge Dinge handhaben, dass Sie sich mit den Java nativen Klassen zu tun haben.