3

リトアニア語 ( ) で ICU を使用してlt_LTいます。この言語のアルファベットは次のとおりです。a ą b c č d e ę ė <...> v z ž

ただし、並べ替えの際、ICU のコレーターは、たとえばaand ą( awith ogonek) が同等であると想定するため、リトアニア語の単語のリストは次のように並べ替えられます。

a, ą, ab, aba, abadas, <...>, b, ba, <...>`

期待される結果が次の場合:

a, ab, aba, abadas, <...>, ą, <...>, b, ba, <...>

他の「アクセント付き」文字 ( e- ę- ėz-žなど)でも同じことが起こります。

より具体的なテストケース: 実行中は、そうでない場合にそれをsource/samples/coll/coll -locale lt_LT -source ą -target aa決定します (必要に応じてcoll.cppを参照してください)。source is less than target

この動作は予期されたものですか? これはバグですか、それとも機能ですか? もしそうなら、どうすれば ICU のコレーターが「類似した」文字を一緒に整列させないようにできますか?

4

1 に答える 1

3

文字はCLDRの調整で二次的な違いとしてリストされているため、そのように並べ替えられます。これが間違っている場合は、ICUの問題ではなく、 CLDRに報告してください。マイマーは同意します。

于 2012-05-19T20:55:42.687 に答える