Ich versuche, mehrere Dateien im Stapel von US-ASCII in UTF-8 zu konvertieren. Ich habe das Problem auf den iconv
connand eingegrenzt, den ich anscheinend falsch benutze, trotz meiner besten Reinigung von Stack Overflow. Irgendeine Idee, was hier schief läuft?Wie kann ich mit iconv von US-ASCII in UTF-8 konvertieren?
Überprüfung der Codierung:
file -i accounting.cfm
accounting.cfm: text/html; charset=us-ascii
Versuch iconv
mit konvertieren:
iconv -f us-ascii -t utf-8 accounting.cfm > accounting.cfm.recode
Überprüfen Sie die Codierung auf die resultierende Datei:
file -i accounting.cfm.recode
accounting.cfm.recode: text/html; charset=us-ascii
Es scheint, die resultierende Datei noch codiert für den US-ASCII-Zeichensatz. Wenn ich eine einzelne Datei über Sublime als UTF-8 (Save With Encoding) speichere, wird der Zeichensatz als utf-8 angezeigt. Ich verstehe, dass das US-ASCII eine Untermenge von UTF-8 ist, aber wenn ich die US-ASCII-kodierte Datei im Browser aufrufe, bekomme ich Müllzeichen (die gefürchteten Fragezeichen in Diamanten, wenn sie in einen Browser geladen werden). Dies ist für eine ältere ColdFusion-Site. Wenn ich die Datei Saved With Encoding through Sublime aufruft, wird mein Fremdzeichensatz korrekt angezeigt. Irgendwelche Ideen, was ich falsch mache? Vielen Dank.
Eine ASCII-Datei ist bereits eine UTF-8-Datei, da UTF-8 abwärtskompatibel ist. 'Datei' druckt den kleinsten gemeinsamen Nenner; Sie müssen nur wissen, was das bedeutet. Voting zum Schließen als unreproduzierbar. – tripleee
Beim Speichern als UTF-8 kann die Stückliste am Anfang der Datei hinzugefügt werden. Diese drei Bytes machen es zu etwas anderem als US-ASCII, ganz absichtlich. Es ist nicht "verstümmelt", Sie verwenden nur ein falsches oder falsch konfiguriertes Werkzeug, um es zu untersuchen. – tripleee
Irgendwelche Vorschläge für ein besseres Werkzeug oder die Verwendung des Befehls 'file'? Danke für deine Antwort. – FlipperPA