この質問は、アクセントを無視したJava文字列検索の続きです。
元の質問に対する答えは、文字列から発音区別符号を削除する方法を示しています。したがって、たとえば、kölnはkolnになります。しかし、łódźはłodzになります-ストロークのあるlに注意してください。
私の質問は、どうすればストロークも削除して、ウッチがウッチになることができるかということです。
ありがとう。
この質問は、アクセントを無視したJava文字列検索の続きです。
元の質問に対する答えは、文字列から発音区別符号を削除する方法を示しています。したがって、たとえば、kölnはkolnになります。しかし、łódźはłodzになります-ストロークのあるlに注意してください。
私の質問は、どうすればストロークも削除して、ウッチがウッチになることができるかということです。
ありがとう。
あなたは、少なくともそのようなすべての手紙について自明ではありません。文字ł
は(外観とそのUnicode名を除いて)まったくリンクさl
れていません(少なくともUnicodeでは、言語的には別の問題です)。
唯一のオプションは、変換する必要のあるすべての文字を入力できるユースケースの変換テーブルである可能性があります。
tchristが示唆したように、私はICU(V 50.1)を使おうとしました。それはLから派生したものとしても認識しませんでした。ストローク付きのLは、Unicodeの特殊なケースのようです。http://bugs.mysql.com/bug.php?id=11369を見てください 。Unicode4.0ではLに接続されていなかったのに対し、Unicode4.1では接続されていたとのことです。Unicode4.1ベースのJavaライブラリで問題をテストした人はいないでしょうか。