2012-11-07 9 views
29

Ich habe gegoogelt (naja, DuckDuckGo'ed, eigentlich) bis ich blau im Gesicht bin, aber nirgendwo eine Liste von Sprachcodes des Typs en-GB oder fr-CA finden kann.Wo finde ich eine Liste der Sprache + Ländercodes?

Es gibt ausgezeichnete Ressourcen über die Komponenten, insbesondere die W3C I18n page, aber ich hoffte auf eine einfache alphabetische Auflistung, ziemlich kanonisch wenn möglich (etwas wie this one). Nicht finden können.

Kann mir jemand in die richtige Richtung zeigen? Danke vielmals!

+0

Der Link * hilft vorgesehen ist * die offizielle Registrierung. Was fehlt in diesem Dokument? –

+0

@ jorg-w-mittag - es könnte naiv sein, aber ich hatte auf eine ziemlich vollständige Liste der üblichen Kombinationen dieses Typs gehofft, nicht nur auf die isolierten Untertags. –

+3

Die genaueste Liste, die ich gefunden habe, ist [diese] (https://msdn.microsoft.com/en-us/library/ee825488%28v=cs.20%29.aspx?f=255&MSPPError=-2147217396) –

Antwort

34

Es gibt mehrere Sprachcodesysteme und mehrere Regioncodesysteme sowie deren Kombinationen. Wenn Sie auf eine W3C-Seite verweisen, nehme ich an, dass Sie sich auf das in BCP 47 definierte System beziehen. Dieses System ist orthogonal in dem Sinne, dass Codes wie en-GB und fr-CA einfach einen Sprachcode und einen Regionencode kombinieren. Das bedeutet eine sehr große Anzahl von möglichen Kombinationen, von denen die meisten wenig Sinn ergeben, wie ab-AX, was Abkhaz bedeutet, wie auf Åland gesprochen (ich glaube nicht, dass irgendjemand, noch weniger jede Gemeinschaft Abchas spricht, obwohl es theoretisch ist natürlich möglich).

Also jede Liste von Sprach-Region-Kombinationen wäre nur eine pragmatische Liste von Kombinationen, die in gewissem Sinne wichtig sind, oder von einer Software in einem speziellen Sinn unterstützt werden.

Die Spezifikationen, die Sie gefunden haben, definieren die allgemeinen Prinzipien und auch die autoritativen Quellen für verschiedene "Untertags" (wie primärer Sprachcode und Regionscode). Für die wichtigsten Teile unterhält die offizielle Registrierungsstelle die three- and two-letter ISO 639 codes für Sprachen und die ISO-Site enthält die two-letter ISO 3166 codes für Regionen. Die Listen sind gut lesbar, und ich sehe keinen Grund, andere als diese primären Ressourcen zu verwenden, insbesondere in Bezug auf mögliche Änderungen.

+1

Danke für die vollständige Erklärung: Sie haben meine Frage klar verstanden und erklärt, warum ich (wahrscheinlich) nicht die Antwort finden werde, auf die ich gehofft hatte! Das ist gut zu wissen. –

+0

Es wäre wirklich großartig, eine kanonische Liste von Kombinationen zu haben, die für diejenigen von uns Sinn machen, die nicht einmal wissen, was Abchas und Åland sind. Schade, dass es das nicht gibt. – melinath

+0

Sie können lesbar sein, aber sie sind auch nicht ausreichend für viele Sprachmarkierungsanforderungen. Persönlich hoffe ich, dass der Spracheintrag in der Entwicklung bei glottolog.org zu einem neuen Standard wird ... – pat

6

Es gibt zwei Komponenten im Spiel hier:

  1. Den Sprach-Tag, die im Allgemeinen durch ISO 639-1 alpha-2
  2. Die Region Tag, die von ISO 3166-1 alpha-2

Sie mischen und anpassen können definiert wird allgemein definiert Sprachen und Regionen in welcher Kombination für Sie sinnvoll ist, so gibt es keine Liste aller Möglichkeiten.

BTW, Sie verwenden effektiv eine BCP47 tag, die die Standards für jedes Gebietsschema Segment definiert.

+0

"... es gibt keine Liste aller Möglichkeiten." Mehr oder weniger, was ich herausgefunden habe, und das ist die "ausführende" Zusammenfassung von Jukkas vollständiger Erklärung, nehme ich an. Es scheint mir immer noch eine Liste der * üblichen * Kombinationen zu geben, die hilfreich sein könnten, aber OTOH, es scheint, als wäre ich ein bisschen isoliert, wenn ich mich so fühle! :) –