Ich habe versucht, ein XML-Dokument (HMTL tatsächlich, aber das spielt keine Rolle) in Java mit org.jdom2.input.SAXBuilder zu analysieren.Parsing mit SAX schlägt fehl wegen '&' in HTML
Das Dokument enthält eine Zeile mit einer URL:
< link rel ="something" href="http://...&pg=2..." />;
Das Problem ist, wird erwartet, ein Semikolon zu haben (;) danach, so werden &pg
einige Symbole, und SAXBuilder gibt einen Fehler, da die das (kein Semikolon nach & pg gefunden).
Gibt es eine Parsing-Option, damit SAX das Zeichen &
nicht als Symbol, sondern wie eine normale Zeichenfolge interpretiert?
Der Unterschied ist, ich will nicht zu speziellen analysieren Charakter, ich will Zeichen analysieren &something
wie sie sind, muss es tatsächlich so standardmäßig sein, und die Haupt Problem ist eine Ausnahme geworfen von Java-Klasse
org.jdom2.input.SAXBuilder
ja, zum Beispiel Netbeans Xml Editor schreiben Sie dasselbe über; pg. ist diese JSout parce zu etwas jdom Element-ähnlich, so dass Sie zu Elementen navigieren könnten? –
JSoup ist ein Apache-Projekt, Open-Source. Es ist für das Parsen von HTML und navigiert das DOM-liked. Sie können verschiedene Knoten, Attribute auswählen und ihre Daten extrahieren ... –