Mein Ziel ist HTML von einem Endbenutzer eingegeben zu nehmen, bestimmte unsichere Tags wie <script>
zu entfernen und es dem Dokument hinzuzufügen. Kennt jemand eine gute Javascript-Bibliothek, um HTML zu bereinigen?Gibt es eine gute JavaScript-basierte HTML-Parsing-Bibliothek?
Ich suchte herum und fand ein paar online, einschließlich John Resig's HTML parser, Erik Arvidsson's simple html parser und Google's Caja Sanitizer, aber ich habe nicht in der Lage gewesen, viele Informationen zu finden, ob die Menschen gute Erfahrungen dieser Bibliotheken mit gehabt haben, und ich mache mir Sorgen, dass sie sind nicht wirklich robust genug, um beliebiges HTML zu verarbeiten. Wäre es besser, wenn ich den HTML-Code zur Bereinigung an meinen Java-Server sende?
Da es besser ist, auf der Serverseite bereinigt zu werden, ist es vielleicht nicht den zusätzlichen Aufwand wert. Wenn Ihr clientseitiger Desinfizierer immer genau die gleichen Ergebnisse liefert wie Ihre Server-Seite, ist es wahrscheinlich nicht wert. –