次のコードがあります。
$pattern = '~[a-z0-9]+~';
preg_match_all($pattern, "some text from a website", $array);
en-The English Language または USA American Engish ではどちらがうまく機能しますが、他のすべての言語でこれを機能させるにはどうすればよいですか? html から chaset と language を検出しました。
編集: http://php.net/manual/en/regexp.reference.unicode.php - http://www.regular-expressions.info/unicode.htmlを使用する必要があると思います
Unicode 正規表現を使用して任意の言語で (a-z0-9) を一致させる方法を知っている人はいますか?
前もって感謝します。