Ich habe Zweifel über XML-Codierung während der Verarbeitung (Unmarshall) der XML-Datei. Wir geben die Codierung der XML-Datei am Anfang der Datei wie folgt ein.Wie entscheidet das Programm die Codierung der XML-Datei?
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
Meine Frage ist, nachdem das Programm diese Zeile liest, es entscheidet, dass der folgende Inhalt in UTF-8 codiert ist. Aber um diese erste Zeile zu lesen, wie entscheidet das Programm, dass es in UTF-8 kodiert ist? Ich meine, beim Lesen des Bytestroms, wie weiß das Programm, dass es die Codierung für die erste Zeile verwenden muss?
Grüße, Mayuran
** Dort ** es ist. Ich habe die Spezifikationen durchgesehen, wusste, dass es da war, aber ich bin nicht ganz auf F.1 gegangen, bevor Sie das oben genannte gepostet haben. Schön. –
@RobAu, danke für die Antwort, aber ich kann immer noch nicht verstehen, um den Text " Xml" zu lesen muss man erst die Kodierung nein entscheiden? Ohne die Codierung zu entscheiden, woher weiß es, dass es " Xml" ist. Ich glaube, mit UTF-8-Codierung ist es nur " Xml". Wenn wir eine andere Codierung verwenden, kann dies als ein anderer Zeichensatz interpretiert werden. Nur mein Gedanke. Bitte lösche mich, wenn ich falsch liege. – Mayuran
Wenn es keine Byte Order Mark gibt, sollten Sie die ersten paar Bytes lesen und die verschiedenen Codierungen ausprobieren, wie UTF-16. Die Codierung, die die Zeichenfolge " Xml" angibt, ist diejenige, die Sie verwenden sollten, um den Rest der Zeile zu lesen. – RobAu