0

次のコードがあります。

$pattern = '~[a-z0-9]+~';
preg_match_all($pattern, "some text from a website", $array); 

en-The English Language または USA American Engish ではどちらがうまく機能しますが、他のすべての言語でこれを機能させるにはどうすればよいですか? html から chaset と language を検出しました。

編集: http://php.net/manual/en/regexp.reference.unicode.php - http://www.regular-expressions.info/unicode.htmlを使用する必要があると思います

Unicode 正規表現を使用して任意の言語で (a-z0-9) を一致させる方法を知っている人はいますか?

前もって感謝します。

4

1 に答える 1

0

答えは、コードを使用することでした 正規表現 どの言語でも [a-z0-9] を表すパターンは次のとおりです。

$pattern = '~[\p{L}\p{Nd}]+~';

ここの非常に役立つ記事: http://www.regular-expressions.info/unicode.html

于 2013-01-21T01:59:19.003 に答える