Ich ziehe Tweets in Python mit Hilfe von Tweepy. Es gibt die gesamten Daten im Typ Unicode. ZB: Druckart (Daten) gibt mir <type 'unicode'>
Entfernen Unicode Zeichen Python
Es enthält Unicode-Zeichen in ihm. ZB: hello\u2026 im am fine\u2019s
Ich möchte alle diese Unicode-Zeichen entfernen. Gibt es einen regulären Ausdruck, den ich benutzen kann? str.replace
ist keine praktikable Option, da Unicode-Zeichen beliebige Werte annehmen können, von Smileys bis zu Unicode-Apostrophen.
Alle Texte sind Unicode. Meinst du * Nicht-ASCII-Zeichen * vielleicht? –
Ja nicht ASCII-Zeichen. Es ist normaler Text in Englisch, der mit \ u2026 usw. durchsetzt ist. – ashish1512