Ich möchte die Anzahl der Buchstaben in einer gegebenen Zeichenfolge erhalten. Len (txt) gibt jedoch die Anzahl der Buchstaben in der Unicode-Form (ich denke), aber die tatsächliche Anzahl der Buchstaben ist weniger als das, was ich bekomme.Python 3 - Anzahl der Buchstaben in einem codierten String
zum Beispiel:
txt = שלום וברכה
len(txt) # returns something different then 10
sah ich eine Lösung für Python 2 string.decode
verwenden, die in Python nicht verfügbar ist 3 - und ich bin nicht sicher, ob es die passende Antwort für mich ist. Übrigens ist die Codierung für die Zeichenfolge cp862
.
EDIT: mehr Details: las ich aus einer Textdatei mit
with open(path, "r", encoding="cp862") as textFile:
dies die Ausgabe der Zeile, die ich lesen, wenn ich es drucken
╫¬╫ñ╫¿╫ש╫ר ╫£╫ª╫ץ╫¥: ╫¢╫ת ╫¬╫ª╫£╫ק╫ץ ╫נ╫¬ ╫¢╫ש╫ñ╫ץ╫¿
Die Länge beträgt 52 Die echte Linie ist: פפפטט צצצם: כך צצצחח אא ככפפר und die tatsächliche Länge ist 29
Auf repl.it bekomme ich:> len ("ששםם בבבככ") => 10. Vielleicht könnten Sie mehr Details über Ihre Plattform und Python-Version zur Verfügung stellen. – Yegers
Ich bekomme dies: '> len ('ששםם בבבככ') >>> 10' – IsaacDj
Geben Sie zumindest tatsächlichen gültigen Code, mit dem das Problem reproduzieren. Dieses Beispiel ist nicht einmal syntaktisch gültig. – deceze