2010-05-25 7 views
28

Ganz einfache Frage. Gibt es eine Möglichkeit, Eclipse so zu konfigurieren, dass es mit Textdateien arbeitet, die mit utf-8 mit und ohne BOM codiert sind?Arbeiten mit utf-8-Dateien in Eclipse

Bisher habe ich Eclipse mit UTF-8-Codierung verwendet und es funktioniert, aber wenn ich versuche, eine Datei von einem anderen Editor, der die Stückliste enthält, zu bearbeiten, behandelt Eclipse es nicht richtig, es zeigt ein unsichtbares Zeichen 'am Anfang der Datei (der Stückliste). Gibt es eine Möglichkeit, Eclipse utf-8-kodierte Dateien mit BOM zu verstehen?

Antwort

18

Sowohl bug 78455 ("Eine Option zum Erzwingen, eine Stückliste in UTF-8-Dateien zu schreiben") als auch bug 136854 lassen keine Hoffnung auf eine solche Option.

Die Unterstützung für die Codierung im Arbeitsbereich auf basiert, was von Java zur Verfügung steht.
Für jede Ressource im Arbeitsbereich ist es möglich, eine Zeichensatzzeichenfolge zu erhalten, die mit allen Java-APIs verwendet werden kann, die Zeichensatzzeichenfolgen verwenden.
Beispiele sind:

  • 'US-ASCII'
  • 'UTF-8'
  • 'Cp1252'
  • 'UTF-16' (Big Endian, BOM eingefügt automatisch),
  • 'UTF-16BE' (Big Endian, Stückliste nicht automatisch eingefügt),
  • 'UTF-16LE' (Little Endian, Stückliste nicht automatisch eingefügt matisch).

Für Java-Codierungen, mit Ausnahme der 'UTF-16' Codierung werden BOMs nicht eingefügt (beim Schreiben) oder verworfen kostenlos (beim Lesen).
Auch wenn dies für Endbenutzer verwirrend ist, so funktionieren alle Java-Anwendungen.
Wenn Anwendungen unterstützen mögen Erstellung UTF-8-Dateien mit Stücklisten ihrer Erwartungen des Benutzers zu entsprechen, müssen sie diese Fähigkeit auf ihrem eigenen (da weder Java noch die Ressourcen-Modell mit, dass helfen) zur Verfügung zu stellen.
Eclipse bietet einige Verbesserungen bei der Erkennung von Stücklisten, jedoch nicht beim Generieren oder Überspringen von Stücklisten.

+5

das ist sehr unbefriedigend – Daniel