1

Ç(ラテン大文字Cとセディラ)に基づいて文字列を分割したいこれまでにstring.split、Splitter.on(pattern).split(line)を試しました

ÇにはUnicode00C7があります

4

2 に答える 2

3

Javaソースファイルが本来あるべきUTF-8である場合、これは完全に機能します。

String[] token = s.split("Ç");

そうでない場合は、

String[] token = s.split("\u00C7"); // Ç

しかし、これははるかに読みにくいです

于 2012-10-11T07:25:06.970 に答える
3

試す

String s = "I want to split a string based on Ç (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)\n" +
        "\n" +
        "Ç has unicode 00C7";
for(String part: s.split("Ç"))
    System.out.println("["+part+"]");

プリント

[I want to split a string based on ]
[ (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)

]
[ has unicode 00C7]
于 2012-10-11T07:26:08.360 に答える