Ich habe eine HTML-Datei und darin kann es Javascript, PHP und all diese Sachen Menschen möglicherweise oder nicht in ihre HTML-Datei einfügen.Finden von Kommentaren in HTML
Ich möchte alle Kommentare aus dieser HTML-Datei extrahieren.
Ich kann dies dabei zwei Probleme hinweisen:
Was ist ein Kommentar in einer Sprache ist, kann in einem anderen kein Kommentar sein.
In Javascript sind die restlichen Zeilen mit dem Marker
//
auskommentiert. Aber URLs enthalten auch//
in ihnen und ich kann daher gut Teile von URLs zu beseitigen, wenn ich nur ersetzen ersetzen//
und dann die Rest der Zeile, mit nichts.
Das ist also kein triviales Problem.
Gibt es irgendwo schon eine Lösung dafür?
Hat schon jemand das getan?
Sie haben Recht, dass dies nicht trivial ist. Um Kommentare zuverlässig zu entfernen, müssen Sie die Datei vollständig analysieren (PHP, HTML und Javascript). Ich schlage vor, wenn möglich in PHP zu arbeiten; Während ich Perl besser mag, sind PHP-Tools, die an sich selbst arbeiten, besser als Perl-Tools, um mit PHP zu arbeiten. Hier ist etwas, um Sie zu beginnen: http://stackoverflow.com/questions/503871/best-way-to-automatisch-remove-comment-from-php-code. Dann müssen Sie nur HTML- und JavaScript-Parser in PHP finden, um dies für diese Teile der Datei zu tun. – dan1111
Warum würden Sie PHP in Ihrer HTML-Datei haben? Ich habe nur CSS, JavaScript und HTML, dann google "HTML-Minifier" für Produkte, die Kommentare, Leerzeichen und generell "schlank" Ihre Seiten entfernen können. –
@RB. Vor gerendert? – Jivings