2016-08-02 10 views
-2

HTML Ich habe in ein kleines Problem eingefallen. Ich bekomme HTML von einer Website und ich bekomme es formatiert korrekt, aber ein Problem hier ist, wo es ein Bild gibt es Whitespaces und der Text beginnt wirklich weit weg.Get HTML exact mit Jsoup

Gibt es eine gute Lösung dafür? Hier ist, wie ich es getan haben:

public class getDetails extends AsyncTask<Void,Void,Void> { 
    @Override 
    protected Void doInBackground(Void... voids) { 
     Document doc,doc_; 
     String test; 
     try{ 
      doc = Jsoup.connect(Global_URL).get(); 
      Elements elements = doc.getElementsByClass("entry-content"); 
      doc_ = Jsoup.parse(elements.toString()); 
      doc_.outputSettings(new Document.OutputSettings().prettyPrint(false)); 
      doc_.select("br").append("\\n"); 
      doc_.select("p").prepend("\\n\\n"); 
      test = doc_.html().replaceAll("\\\\n","\n"); 
      test = Jsoup.clean(test,"",Whitelist.none(),new Document.OutputSettings().prettyPrint(false)); 
      dialog_desc = test; 
      //dialog_desc = elements.text().toString(); 

     } 
     catch (Exception e){ 
      e.printStackTrace(); 
     } 
     return null; 
    } 
+0

Geben Sie ein Beispiel für den HTML-Code an, mit dem Sie Zeilenumbrüche hinzufügen möchten. –

Antwort

-1

Statt mit Jsoup.parse() und .html() Früher habe ich nur die .Text() und das Problem, wo gelöst.