1 つのアプローチは、言語範囲に関する既知の情報を使用することです。たとえば、Unicode の範囲 30A0–30FF は日本語のカタカナ文字を表すため、文字列がその範囲内の文字で構成されている場合、知識に基づいてそれが日本語であると推測し、それに応じて機能する可能性があります。
これには、Java で Unicode 言語ページを処理する方法を知る必要があります。
助けてください
Javachar
は 16 ビットのユニコードです。文字列を取得して、その文字を解析します。
String string = getString(); // returns the string you will parse
boolean japaneseChars = true;
for (ii=0; ii<string.length; ii++) {
char character = string.charAt(ii);
if (!(character >= 0x30A0 && character<= 0x30FF)) {
japaneseChars = false;
}
}