java - Unicode を使用して文字列をある言語から別の言語に変換する

Question

1 つのアプローチは、言語範囲に関する既知の情報を使用することです。たとえば、Unicode の範囲 30A0–30FF は日本語のカタカナ文字を表すため、文字列がその範囲内の文字で構成されている場合、知識に基づいてそれが日本語であると推測し、それに応じて機能する可能性があります。

これには、Java で Unicode 言語ページを処理する方法を知る必要があります。

助けてください

score 1 · Accepted Answer

Javacharは 16 ビットのユニコードです。文字列を取得して、その文字を解析します。

String string = getString(); // returns the string you will parse
boolean japaneseChars = true;
for (ii=0; ii<string.length; ii++) {
    char character = string.charAt(ii);
    if (!(character >= 0x30A0 && character<= 0x30FF)) {
         japaneseChars = false;
    }
}

java - Unicode を使用して文字列をある言語から別の言語に変換する

1 に答える 1

Related

Reference