はい、Locale.ENGLISH
プログラミング言語の識別子や URL 部分などのケース操作には安全な選択です。これは、特別な大文字と小文字の規則がなく、すべての 7 ビット ASCII 文字が ENGLISH ケース変換で 7 ビット ASCII 文字に変換されるためです。
これは、他のすべてのロケールには当てはまりません。トルコ語では、「I」と「i」の文字は互いに大文字と小文字が変換されません。
「点線と点線のない私」は次のように説明しています。
ラテン文字の変種であるトルコ語のアルファベットには、I の 2 つの異なるバージョン (ドット付きとドットなし) が含まれています。
Unicode では、U+0131 はドットのない小文字の i (ı) です。U+0130 (İ) は大文字の i にドットを付けたものです。ISO-8859-9 では、それぞれ 0xFD と 0xDD の位置にあります。通常のタイポグラフィでは、小文字の i が他の分音符号と組み合わされる場合、通常、分音符号が追加される前にドットが削除されます。ただし、論理的には通常のドット付き i 文字が変更されるため、Unicode では、ドット付き i を含む同等の結合シーケンスが引き続きリストされます。
ほとんどの Unicode ソフトウェアは、大文字の ı を I に、小文字の İ を i に変換しますが、特にトルコ語用に設定しない限り、I を i に、i を大文字に変換します。したがって、大文字の後に小文字を使用するか、またはその逆を行うと、文字が変更されます。
特別な例外のリストは、 http: //unicode.org/Public/UNIDATA/SpecialCasing.txtで管理されています。
# ================================================================================
# Turkish and Azeri
# I and i-dotless; I-dot and i are case pairs in Turkish and Azeri
# The following rules handle those cases.
0130; 0069; 0130; 0130; tr; # LATIN CAPITAL LETTER I WITH DOT ABOVE
0130; 0069; 0130; 0130; az; # LATIN CAPITAL LETTER I WITH DOT ABOVE
# When lowercasing, remove dot_above in the sequence I + dot_above, which will turn into i.
# This matches the behavior of the canonically equivalent I-dot_above
0307; ; 0307; 0307; tr After_I; # COMBINING DOT ABOVE
0307; ; 0307; 0307; az After_I; # COMBINING DOT ABOVE
...