このトピックについていくつか読んだことがありますが、それでもコミュニティと共有したい疑問があります.
私が開発したアプリケーション DaDaBIK に完全な utf-8 サポートを追加したいと考えています。アプリケーションは、さまざまな DBMS (MySQL、PostgreSQL、SQLite など) で使用できます。データベースで使用される文字セットは ANY にすることができます。文字セットを設定または想定することはできません。
私のアプローチは、iconv 関数を使用して、db から utf-8 で読み取ったすべてを変換し、DB に書き込む必要があるときに元の文字セットに変換することです。これにより、utf-8 で作業していると仮定できます。
問題は、おそらくご存じのとおり、PHP がネイティブで utf-8 をサポートしていないことです。また、mbstring を使用すると仮定しても、( http://www.phpwact.org/php/i18n/utf-8によると)存在します。 PREG 拡張機能、strcspn、trim、ucfirst、ucwords など、utf-8 および DON で問題を引き起こす可能性のあるいくつかの PHP 関数には、mbstring 対応がありません。
adodb や htmLawed などの外部ライブラリを使用しているため、すべてのソース コードを制御することはできません...これらのライブラリでは、これらの関数を使用するケースがいくつかあります....何かアドバイスはありますか? そして何よりも、ワードプレスなどの非常に人気のあるアプリケーションは、この (IMHO 大きな) 問題をどのように処理していますか? 彼らがコードに「トリム」を持っていないとは思えません....彼らはリスクを冒しているだけですか(データの破損など)、それとも私が見ることができないものがありますか?
どうもありがとう。