regex.hライブラリを使用して、ラテン文字以外の文字(アラビア語、中国語など)が少なくとも1つ含まれているすべての単語を検索するにはどうすればよいですか?
cityدبي
どうですか:
(?=\pL)(?![a-zA-Z])
これは、ラテン文字以外の任意のアルファベットの文字に一致します。
not ok - cityدبي
ok - city
not ok - دبي
これを試して :
[a-zA-Z]*[^A-Za-z \d]+[a-zA-Z]*
意味 : 1 つまたは複数の非ラテン文字の前または後に 1 つまたは複数のラテン文字が続く、つまり少なくとも 1 つの非ラテン文字を含む単語。ランダムなテキストを含むデモを参照してください: http://regexr.com?326s3
この正規表現をニーズに合わせて調整し、入力に従って数字、特殊文字、単語境界などを含める必要がある場合があります。
一致しない場合は使用[^a-zA-Z]
してください。国際文字が含まれている必要があります...