Hindi(Devanagri) (UTF-16) で記述されたファイルを検索すると、以下の問題が発生しました。
ファイルには次が含まれます。
तरास ततत जुग नींद ना हा बु
最初の文字 'तर' は त + ् + र の複数のコード ポイントであることに注意してください。'त' を検索すると、最初の文字の त を含む 4 つの一致が得られます。私はJavaを使用しています。
複数のコード ポイント文字の一部ではない「त」を検索するにはどうすればよいですか。
どんな助けでも大歓迎です。:)