2016-07-13 8 views
1

Ich habe eine Textdatei, die eine seltsame codierte Zeichen enthält, die ursprünglichen Zeichen der Datei waren arabische Zeichen.Textdatei Falsche Codierung Problem

Als Beispiel: die Datei enthält diese Zeichenfolge ÝíæáÇ ãÍÝæÑ äquivalent, die فيولا محفور

andere hier einige Beispiele:

ÈÇÑíÜÜÜÜÜÒ = باريـــــز 
ÏíäÇ ÔÇÌ = دينا شاج 
ßíÑãÇäì ãÍÝæÑ = كيرمانى محفور 
ÇäÌì ÈÇáÝæã ãßãáÇÊ = انجى بالفوم مكملات 
ÓÈÔíÇá ÑæíÇá 35 ãáã = سبشيال رويال 35 ملم 

eine Möglichkeit, den Inhalt der Datei zu seiner ursprünglichen arabischen Zeichen Gibt es ist wieder zurück ?

Hinweis: Ich verwende die Programmiersprache C#.

+1

Vielleicht „[Der absolute Minimum Jeden Software-Entwickler absolut positiv muß über Unicode und Zeichensätze weiß (keine Ausreden!)] (Http: //www.joelonsoftware.com/articles/Unicode.html) "von Joel Spolsky kann helfen? –

+0

+1 für die Referenzierung Joel! Dieser Artikel ist etwas, das ich in mein Gehirn gebrannt habe, als ich es in den alten Tagen gelesen habe :) – pid

Antwort

0

Ich bin nicht vertraut mit arabischen Kodierungen, aber ich nehme an, dass Ihre Textdatei mit einer Windows-1256 Codepage codiert ist.

So müssen Sie diese Codepage angeben, wenn Sie die Datei zu lesen:

var text = File.ReadAllText(pathToFile, Encoding.GetEncoding(1256)); 
+0

Danke, Das hat das Problem gelöst – user1986570