Die Lösungen in anderen Antworten funktionieren nicht, wenn ich sie versuche, die gleiche Zeichenfolge ausgibt, wenn ich diese Methoden ausprobiere.Dekodierung kaufmännischer Hash-Zeichenfolgen (& # 124 & # 120 & # 97) usw.
Ich versuche Web Scraping mit Python 2.7 zu tun. Ich habe die Webseite heruntergeladen und es hat einige Zeichen, die in der Form x
sind, wobei 120 den ASCII-Code zu repräsentieren scheint. Ich versuchte mit HTMLParser()
und decode()
Methoden, aber nichts scheint zu funktionieren. Bitte beachten Sie, dass ich von der Webseite im Format nur diese Zeichen habe. Beispiel:
Blasterjaxx 
Bitte leite mich diese Strings mit Python zu entschlüsseln. Ich habe die anderen Antworten gelesen, aber die Lösungen scheinen nicht für mich zu funktionieren.
Sie sind nicht gültig [Zeichenreferenzen] (https://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references#Character_reference_overview): sie das abschließende Semikolon fehlen. Aber sobald diese Semikolons hinzugefügt sind, dekodiert das Beispiel zu "Blasterjaxx" –
Versuchen Sie, Codierung explizit anzugeben, während Sie diese Seiten herunterladen – frist