Ich spielte mit Python-Unicode und Encoding-Methoden herum, ich benutzte das Sonderzeichen "‽" und ein chinesisches Zeichen, um zu sehen, wie verschiedene utf-Codierung mit diesen Zeichen umgehen, und ich bekomme diese Ausgabe.Python2.7, was bedeuten die Sonderzeichen in der utf-32-Kodierungsausgabe einer Unicode-Zeichenfolge?
>>> a = u"‽"
>>> encoded_a = a.encode('utf-32')
>>> a
u'\u203d'
>>> encoded_a
'\xff\xfe\x00\x00= \x00\x00'
>>> b = u"安"
>>> encoded_b = b.encode('utf-32')
>>> b
u'\u5b89'
>>> encoded_b
'\xff\xfe\x00\x00\x89[\x00\x00'
Meine Frage ist, was bedeutet das Gleichheitszeichen und die equare Klammer im codierten Ergebnis?
Python fügt die Stückliste ein, wenn Sie eine Codierung verwenden, die größer als 8 Bit ist, ohne Endianess anzugeben. Um die BOM zu verlieren, benutze 'utf-32le'' oder' utf-32be''. –