2010-04-06 8 views
6

Ich habe ein Dokument von Englisch auf Norwegisch im LaTeX-Format übersetzt und während norwegische Sonderzeichen verwenden, bekomme ich einen FehlerKeine norwegischen Zeichen in LaTeX

\usepackage[utf8x]{inputenc} 

mit der norwegischen (skandinavisch), um zu versuchen und zeigen Sonderzeichen in Postscript/PDF/DVI-Format, sagen

Package utf8x Error: MalformedUTF-8sequence. 

So, während das nicht funktionierte, habe ich versucht, eine andere mögliche Lösung aus:

\usepackage{ucs} 
\usepackage[norsk]babel 
Und

, als ich versuchte, dass ich diese Nachricht in Emacs zu speichern:

These default coding systems were tried to encode text 
in the buffer `lol.tex': 
(utf-8-unix (905 . 4194277) (916 . 4194245) (945 . 4194278) (950 
. 4194277) (954 . 4194296) (990 . 4194277) (1010 . 4194277) (1013 
. 4194278) (1051 . 4194277) (1078 . 4194296) (1105 . 4194296)) 
However, each of them encountered characters it couldn't encode: 
utf-8-unix cannot encode these: \345 \305 \346 \345 \370 \345 \345 \346 \345 \370 ... 

Dank Emacs habe ich die Möglichkeit, die Eigenschaften dieser Zeichen zu überprüfen, und die ersten sagt mir:

character: \345 (4194277, #o17777745, #x3fffe5) 
preferred charset: eight-bit (Raw bytes 128-255) 
code point: 0xE5 
syntax: w which means: word 
buffer code: #xE5 
file code: not encodable by coding system utf-8-unix 
display: not encodable for terminal 

Das sagt mir nicht viel. Wenn ich versuche, das mit texi2dvi --dvipdf filename.text zu erstellen, bekomme ich ein perfektes PDF, alles ohne die speziellen norwegischen Zeichen.

Wenn ich über Emacs mich auch speichern fragen: „Wählen Sie Codierungssystem (Standard raw-Text):“ Und ich tippe in utf-8 sein Codierungssystem zu wählen. Ich habe auch versucht, Standard-Rohtext zu wählen, um zu sehen, ob ich ein anderes Ergebnis erhalte. Aber nichts.

Endlich habe ich versucht \ lstset {inputencoding = utf8x, extendedchars = \ true} ... ein Code, den ich kam beim Versuch, die Lösung für dieses Problem an Google. Das gibt mir diesen Fehler: Nicht definierte Steuersequenz.

Also im Grunde habe ich jede Kodierungsoption ausprobiert, die ich gefunden habe und nichts funktioniert. Ich versuche verzweifelt, diese Arbeit zu machen, da die norwegische Übersetzung vor Ablauf der Frist veröffentlicht werden muss.

Als zusätzliche Information kann ich hinzufügen, dass ich später herausfand, dass ich nur die en_US.UTF-8 in meinem Gebietsschema hatte, also fügte ich nb_NO.UTF-8 und nb_NO.ISO-8859-15 hinzu und führte locale -gen + Neustart ohne Änderungen.

Ich hoffe, ich habe genug Informationen zur Verfügung gestellt, um Hilfe zu bekommen, die betreffenden Charaktere sind æ ø å.

+1

Die Tatsache, dass die Datei aufgerufen wird 'lol.tex' bringt mich zum Lächeln. –

+0

Es heißt wirklich was-ist-fs.tex, aber ich habe eine --recode auf dem einen, also brauchte ich eine neue Kopie und meine Phantasie hat keine anderen guten Vorschläge ausgelöst. – bleakgadfly

Antwort

4

Offenbar hat Ihre Emacs es schwer, die Datei als UTF-8 zu speichern (was nicht viel Sinn macht, da es in der Lage sein sollte, alle Zeichen mit dieser Kodierung darzustellen). Sie sollten versuchen, einen anderen Editor mit Unterstützung für mehrere Kodierungen zu verwenden, um die Datei als UTF-8 zu speichern.

Während Sie die Datei nicht in UTF-8 speichern können, kann LaTeX sie nicht korrekt lesen, es sei denn, Sie geben Ihre aktuelle Dateicodierung als Paketparameter an. Sie können beispielsweise versuchen, die Datei unverändert in Emacs zu speichern, aber \usepackage[latin1]{inputenc} anzugeben, was den Zweck erfüllen sollte, wenn Emacs die Datei mit etwas aus der * iso-8859 - ** - Familie schreibt.

+0

Super! Ich kann nicht glauben, dass das Ganze Emacs war. Ich habe nur die ganze Datei in gedit kopiert und es hat Wunder gewirkt. Ich frage mich, was das Problem mit Emacs war, wirklich schade. Danke, trotzdem! – bleakgadfly

+0

Ich bekomme ähnliche Fehler in Emacs über Char. Codierung beim Einfügen aus Dokumenten mit unterschiedlichen Codierungen. – Mica

4

löste ich diesen Fehler durch die Codiersystem Einstellung für Datei zu speichern:

C-x C-m f utf-8-unix 
+0

Ich auch. Ich habe utf-8 als Datei-Encoding verwendet. –