Was ich tun möchte ist, ändern Sie jedes Tag (ob seine <a href=>
oder <title>
oder </title>
oder </div>
... etc) zu einem Symbol.Ändern Sie alle HTML-Tags zu Symbol mit Python
Ich habe versucht, schöne Suppe verwenden, aber es findet nur Tags, die ich definieren ...
ich einige Code in der HTMLparser.py gefunden
tagfind = re.compile('([a-zA-Z][^\t\n\r\f />\x00]*)(?:\s|/(?!>))*')
Ich glaube, das ist das, was ich suche Ich weiß einfach nicht, wie man es richtig benutzt.
Auch dachte ich, ich das verwenden könnte:
handle_starttag(self, tag, attrs):
Aber ich will nicht den Tag definieren, ich will nur das Skript jeden einzelnen Tag zu finden und es zu etwas ändern ...
Ist das möglich?
Vielen Dank für Ihre Hilfe !!
Das ist eine Menge von Tags. Was ist dein ultimatives Ziel? –
Um jedes Tag aus dem HTML zu entfernen und durch ein Symbol zu ersetzen –
Ich meine, warum willst du das tun? –