私は最近、単純にデータベースに追加するスクリプトを作成しました。ただし、挿入されるテキストはチェコ語です。これまでのところ、英語の入力を想定していないものを作ったことがないので、エンコーディングに関しては初心者です。
チェコ語には、ěščřžýáíéúů という特殊文字があります。ř, ú, ů, č を除いて、それらはすべて動作すると思います: �? に変換されるだけです。どうすればこれを修正できますか?
私は現在やっていてhtmlentities($text, ENT_QUOTES,'UTF-8')
、それをでデコードしhtml_entity_decode($text)
ます。
データベースはutf8_czech_ci
エンコーディングを使用しています。
ご協力ありがとうございました!
編集: htmlentities 部分全体を取り出すと、同じ結果が得られますが?
、一部の文字の代わりに: が表示されます。