Ç(ラテン大文字Cとセディラ)に基づいて文字列を分割したいこれまでにstring.split、Splitter.on(pattern).split(line)を試しました
ÇにはUnicode00C7があります
Ç(ラテン大文字Cとセディラ)に基づいて文字列を分割したいこれまでにstring.split、Splitter.on(pattern).split(line)を試しました
ÇにはUnicode00C7があります
Javaソースファイルが本来あるべきUTF-8である場合、これは完全に機能します。
String[] token = s.split("Ç");
そうでない場合は、
String[] token = s.split("\u00C7"); // Ç
しかし、これははるかに読みにくいです
試す
String s = "I want to split a string based on Ç (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)\n" +
"\n" +
"Ç has unicode 00C7";
for(String part: s.split("Ç"))
System.out.println("["+part+"]");
プリント
[I want to split a string based on ]
[ (Latin Capital letter C with cedilla) so far i have tried string.split, Splitter.on(pattern).split(line)
]
[ has unicode 00C7]