Twitter のトレンドから特殊文字を削除する必要があります。のような URL を形成するためにトレンドが使用されるためhttp://example.com/trends/trending-topic
です。
Gävleのような特殊文字があると、醜い URL になります。それらの文字を削除するにはどうすればよいですか。トレンドで使用できる文字のリストはありますか?
これは両刃の剣です。
この機能を使用iconv()
して//TRANSLIT//IGNORE
、UTF-8 文字列を US-ASCII などのより少ない文字セットに変換しようとすることができます。フラグは//TRANSLIT
、目的の文字セットで意味のあるものに変換できる文字を変換します。 //IGNORE
文字変換または元のエンコーディングにエラーがある場合、iconv が停止するのを防ぎます。
音訳できない文字は削除されることに注意してください。ターゲットの文字セットがソースからの文字を表現できるほど、より良いものになります。たとえば、多くのヨーロッパ言語は問題なく US-ASCII に音訳できますが、キリル文字やアジア大陸の言語などを移植しようとすると、大惨事になります。ここで諸刃の剣の出番です。URL の UTF エンコードは視覚的に見苦しいかもしれませんが、長期的にはうまくいく可能性が最も高い方法です。