Hier sind ein paar Beispiele (Unicode) string:Wie konvertiert man eine Unicode-Zeichenfolge in eine literale Zeichenfolge in Python?
a = u'\u03c3\u03c4\u03b7\u03bd \u03a0\u03bb\u03b1\u03c4\u03b5\u03af\u03b1 \u03c4\u03bf\u03c5'
b = u'\u010deprav so mu doma\u010di in strici duhovniki odtegovali denarno pomo\u010d . Kljub temu mu je uspelo'
c = u'sovi\xe9ticas excepto Georgia , inclusive las 3 rep\xfablicas que hab\xedan'
Mein Endziel ist auf den umgekehrten Schrägstrichen aufzuteilen (und Leerzeichen), so dass es wie folgt aussieht:
split_a = [u03c3, u03c4, u03b7, u03bd, ,u03a0, u03bb, u03b1, u03c4, u03b5, u03af, u03b1, ,u03c4, u03bf, u03c5]
split_b = ['', 'u010deprav', 'so', 'mu', 'doma', 'u010di', 'in', 'strici', 'duhovniki' odtegovali denarno pomo', 'u010d', '.', 'Kljub', 'temu', 'mu', 'je', 'uspelo']
split_c = ['sovi', 'xe9ticas', 'excepto', 'Georgia', ',', 'inclusive', 'las', '3', 'rep', 'xfablicas', 'que', 'hab', 'xedan']
(Das leere Orte, an denen sowohl ein Leerzeichen als auch ein Backslash vorhanden sind, sind völlig in Ordnung.
Wenn ich versuche, dies zu teilen mit:
a.split("\\")
, ist es nicht die Zeichenfolge überhaupt zu ändern.
Ich sah dieses Beispiel here, die mich denken lassen, dass ich meine Strings Literalstrings machen muss (mit r
). Ich weiß jedoch nicht, wie ich meine große Liste von Strings in alle literalen Strings konvertieren soll.
Als ich danach suchte, bekam ich here. Mein Compiler gibt jedoch einen Fehler aus, wenn ich a.encode('latin-1').decode('utf-8')
ausführen. Der Fehler ist 'latin-1' codec can't encode characters in position 0-3: ordinal not in range(256)
Also meine Frage ist: Wie kann ich eine Liste von Unicode-Strings nehmen, programmatisch durchlaufen durch sie und machen sie String-Literale, und dann auf einen Backslash aufgeteilt?
Python ist eine interpretierte Sprache, so dass der Python-Interpreter den Fehler führt. – linusg
Ich denke du bist ein bisschen über meinem Level, aber danke für die Info! –