24

アプリケーションの REST API を介して、次の形式の言語コードを受け取ります: ll-Xxxx.

  • 2 つの小文字言語 ( ISO 639-1のように見えます)、
  • ダッシュ、
  • 大文字で始まる 4 文字までのコード (ISO 639-3マクロ言語コードのように見えます)。

いくつかの例:

az-Arab Azerbaijani in the Arabic script
az-Cyrl Azerbaijani in the Cyrillic script
az-Latn Azerbaijani in the Latin script

sr-Cyrl Serbian in the Cyrillic script
sr-Latn Serbian in the Latin script

uz-Cyrl Uzbek in the Cyrillic script
uz-Latn Uzbek in the Latin script

zh-Hans Chinese in the simplified script
zh-Hant Chinese in the traditional script

私がオンラインで見つけたものから:

[ ISO 639-1 ] は、言語コードの国際規格 ISO 639 シリーズの最初の部分です。パート 1 では、2 文字コードの登録について説明します。

ISO 639-3は言語コードの国際規格です。その言語コードのいくつかを定義する際に、一部はマクロ言語として定義されています [...]

次に、有効な言語コードを受け取ったことを確認するコードを作成する必要があります。
しかし、私が受け取ったのは 639-1 (2 文字の言語) と 639-3 (マクロ言語) が混在しているため、どの標準に従うべきでしょうか? これらのコードは、ある種の混同された (おそらく一般的な) 標準に属していますか?

4

2 に答える 2

14

言語を識別するための現在のリファレンスは、IETF RFC 5646 と RFC 4647 を組み合わせたIETF BCP 47です。

フォームのコードはll-Xxxx、ISO 639-1言語コード(2 文字) とISO 15924 スクリプト コード(4 文字) を組み合わせたものです。BCP 47 では、言語コードは小文字で、スクリプト コードは「頭文字を大文字にして小文字で」書くことを推奨していますが、これは基本的に読みやすさのためです。

BCP 47 では、言語コードは利用可能な最も短い ISO 639 タグにすることも推奨しています。したがって、ある言語がISO 639-1 (2 文字) とISO 639-3 (3 文字) の両方で表現されている場合は、ISO 639-1 を使用する必要があります。

于 2016-08-15T16:47:15.607 に答える
13

RFC-5646 (4 ページ)に従って、言語タグは[language]-[script]の形式で記述できます。

于 2013-09-21T13:53:19.967 に答える