éáßöäü
URL とファイル名をサニタイズする機能がありeassoau
ますstr_replace($a, $b, $value)
。しかし、中国語、日本語などの言語のすべての文字を置き換えるにはどうすればよいでしょうか? また、判断が難しいために置換できない場合、それらの文字をすべて削除するにはどうすればよいですか? もちろん、最初に上記のようにサニタイズしてから、「非ラテン」文字をすべて削除することもできます。しかし、おそらくそれに対する別の良い解決策がありますか?
編集・追加
コメントで尋ねられたように: 私の質問の目的は何ですか? 最初は英語、ドイツ語、ロシア語のコンテンツを持っていたクライアントがいました。その後、中国語のページがいくつかありました。URL で 2 つの問題が発生しました。
- 最初のサニタイザーはすべての「ASCII 以外の文字」を削除し、「空白」(無効な) クリーン URL を返した可能性があります。
- クライアントは、一部のブラウザで中国語の文字を含むクリーンな URL が機能しないことを経験しました。
最初のポイントは、それらの文字を置き換えるショットに私を導きました.もちろん、質問とコメントで述べられているように、それは不可能です. たぶん、誰かが、最新のすべてのブラウザー (IE8 以降) では、これはもう問題ではないと答えています。また、そのことについてもお聞かせいただければ幸いです。