Web サイトの文字に問題があります。
私は、ユーザーが wysiwyg エディター (ckeditor) を使用してプロファイルを入力できる Web サイトを持っています。コンテンツは、データベースに配置される前に htmlpurify を介して実行されます (セキュリティ上の理由から)。
データベースには、すべてのテーブルが UTF-8 文字セットで設定されています。また、問題を防ぐために、スクリプト実行の開始時に「SET NAMES utf-8」を呼び出します (この問題は長い間発生していないため、これは何年も機能しています)。テキストが表示される Web ページの content-type は utf-8 で、header() 関数を使用して content-type と charset も設定します。
テキストを表示するとき、コンテンツで正規表現を実行しようとするまで、すべて問題ないように見えました。html_entity_decode (「utf-8」のエンコーディング パラメータで呼び出される) は何らかの理由で Â 文字を削除/表示せず、すべての正規表現が失敗する原因となっているものを残します (そこに文字があるようですが、できません)ソースで確認してください)。
正規表現を実行できるように、この文字を防止または削除するにはどうすればよいですか?
編集:私は ckeditor を放棄し、このサイトがより柔軟に使用するようなマークダウン形式を使用することにしました。覚えている限り、私は wysiwyg エディターが嫌いでした。すべてのプロファイルを新しい形式に更新すると、問題のあるテキストをすべて削除して、サイトをクリーンなスタートにすることができます。すべての入力に感謝します。