Pattern
すべてのUnicode数字と英字に一致するを作成する必要があります。これまでのところ私は持ってい"\\p{IsAlphabetic}|[0-9]"
ます。
最初の部分は私にとってうまく機能しており、非ラテン文字をアルファベット文字として識別するのに適しています。問題は後半です。明らかに、それはアラビア数字に対してのみ機能します。キャラクタークラス\\d
とも\p{Digit}
ただ[0-9]
です。のjavadocはPattern
、Unicode数字の文字クラスについて言及していないようです。誰かがこの問題の良い解決策を持っていますか?
私の目的では、をCharacter.isDigit
返すすべての文字のセットを一致させる方法を受け入れますtrue
。