php - トルコ語の文字で正規表現が正しく機能しない

Question

次のパターンを抽出する正規表現を作成します。

これが私が試している正規表現です。

問題は、トルコ語の文字で正規表現演算子を使用している可能性があると思います。どうすればこれを解決できるかわかりません。

http://www.myregextester.comを使用して、正規表現が正しいかどうかを確認しています。

私は PHP プログラミング言語を使用して、Twitter Rest Api を介して検索されたツイートから特定のパターンを取得しています。

ありがとう、

score 4 · Accepted Answer

使用しているプログラミング言語を指定していませんが、それらの多くでは、\b文字クラスはプレーン ASCII エンコーディングでのみ使用できます。

内部的にはとセット\bの境界として処理されます。次に、に等しいです。\w\W
\w[a-zA-Z0-9_]

ファンシースペースマークを使用していない場合 (使用すべきではありません)、通常の空白文字クラス ( \s) の使用を検討してください。

お使いの言語が\b. "ascii"と表示されている場合は、そうではありません。

補足として、プログラミング言語によっては、国別文字の代わりに直接 Unicode コードポイントを使用することを検討することもできます。

参考文献：

1 に答える 1