Derzeit arbeite ich an der Konvertierung von HTML-Codes mit entsprechenden Zeichen in Java. Ich muss den folgenden Code in Zeichen konvertieren.Ersetzen Sie HTML-Codes durch äquivalente Zeichen in Java
è - è
® - ®
& - &
ñ - ñ
& - &
Ich versuchte, das RegexMuster mit
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Wenn ich debuggen, matcher.find()
gibt mir true
aber die Steuerung überspringt die Schleife, wo ich den Code für die Konvertierung geschrieben haben. Ich weiß nicht, was dort passiert.
Gibt es auch eine Möglichkeit, diesen Regex zu optimieren?
Jede Hilfe wird geschätzt.
Exception
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)
Es ist bereits beantwortet :). [Empfohlene Methode zum Entkommen von HTML in Java] (http://stackoverflow.com/questions/1265282/recommended-method-for-escaping-html-in-java) –