私はこれまで英語のみであったアプリケーションを持っています。テンプレートとデータベース全体のコンテンツエンコーディングはUTF-8です。私は現在、アプリケーションを国際化/翻訳して、UTF-8を絶対に必要とする文字セットを持つ言語に変換することを検討しています。
アプリケーションは、、、などのさまざまなPHP文字列関数を使用します。マルチバイト文字を正しく処理するには、これらを、、、strlen()
などのマルチバイト文字列関数に切り替える必要があると理解しています。私はこのトピックを少し読んでみましたが、事実上、私が見つけることができるすべてのものが「エンコーディング理論」に深く入り込んでおり、質問に対する簡単な答えを提供していません。たとえば英語とアラビア語の両方で正常に動作することを使用して期待していますか、それとも私がまだ注意する必要がある何かがありますか?strpos()
substr()
mb_strlen()
mb_strlen()
mb_substr()
strlen()
mb_strlen()
どんな洞察も歓迎されます、そして私が私の相対的な無知で彼らの心の近くでエンコーディングをしている誰かを怒らせているならば、謝罪します。