Ich verwende einen HTML-Parser namens Jsoup, um HTML-Dateien zu laden und zu analysieren. Das Problem ist, dass die Webseite, die ich scrapping ist in ISO-8859-1
Zeichensatz codiert, während Android UTF-8
Codierung (?) Verwendet. Dies führt dazu, dass einige Zeichen als Fragezeichen angezeigt werden.Wie konvertiere ich eine Zeichenfolge in UTF-8 in Android?
So jetzt denke ich, ich sollte die Zeichenfolge in UTF-8-Format konvertieren.
Jetzt habe ich diese Klasse namens CharsetEncoder im Android SDK gefunden, was ich denke, könnte mir helfen. Aber ich kann mir nicht vorstellen, wie ich es in der Praxis umsetzen soll, also frage ich mich, ob ich mit Hilfe eines praktischen Beispiels Hilfe bekommen könnte.
UPDATE: Code zum Lesen von Daten (Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
Könnten Sie den Code verwendet, senden Sie uns eine HTML-Dokument zu lesen? – yanchenko
OK, ich habe meinen Beitrag aktualisiert. – droidgren