2016-04-13 15 views
0

Ich habe ein Problem in meiner Datenbank, wo einige der kyrillischen Text so gesehen wird "болно Ð±Ð°Ñ Ð°Ð¼ÑŒÐ´Ñ€ÑƒÑƒÐ»Ð¶ ч Ð". Gibt es eine Möglichkeit, dies in ein für Menschen lesbares Format umzuwandeln?Konvertieren von "Ð ± оÐ" но "in kyrillisch

Ich muss tatsächlichen Kontext davon lesen.

+1

Welche Kodierung wurde verwendet, um das zu bekommen? Veröffentlichen Sie die rohen Byte-Daten nicht den falsch dekodierten Mojibake. –

Antwort

2

Beste, die ich von Ihren Daten machen könnte ... es sieht kyrillisch aus, aber Google Translate hat nichts daraus gemacht. Es scheint, dass es unter dem Standard-US-Windows-Codec entschlüsselt wurde, aber es war wirklich UTF-8, aber die Daten sind nicht ganz richtig. Ich verwende Python, um zu versuchen, es zu beheben:

>>> s.encode('cp1252').decode('utf8',errors='replace') 
'болно ба� амьдруулж ч �' 
+1

In Windows-1252 entsprechen die folgenden Bytes keinem Zeichen: h81, h8D, h8F, h90 und h9D. Mit einem führenden hD1-Byte in UTF-8 ("Ñ") entsprechen sie den kleinen kyrillischen Buchstaben с, э, я, ѐ und ѝ. Mit einem führenden hD0 ('Ð ') wäre das stattdessen ein Großbuchstabe Ё, Ѝ, Џ, À und Í. Dies sind die kyrillischen Buchstaben, die als Ersatz char ' ' angezeigt werden, da das OP nicht die exakte Byte-Zeichenkette lieferte und so das illegale Byte einfach fallen gelassen wurde. Wenn das Russisch ist, war das verdorbene Wort wahrscheinlich "und auch" oder vielleicht "die Reichen". – Crissov