あなたのファイルは Windows-1252 でエンコードされている可能性が非常に高く (どこで に0xB7
デコードされます·
)、gEdit はそれを UTF-8 としてデコードし、無効な UTF-8 バイト (0xB7
特定のシーケンスの外にある場合、UTF-8 では無効です) を値として直接表示します I推測してみて。多くの方法でファイルを修正できますが、PHP では次のことができます。
<?php
$file_contents = file_get_contents("brokenfile.txt");
$file_contents = mb_convert_encoding($file_contents, "UTF-8", "Windows-1252");
file_put_contents("brokenfile.txt", $file_contents);
上記のスクリプトは、ファイルを Windows-1252 としてデコードし、UTF-8 としてエンコードします。
テキスト エディターを使用すると、通常は「名前を付けて保存」ダイアログまたは何らかの構成で、ファイルを保存するエンコードを指定できます。エディターを使用する前に、常にエディターのエンコーディングを構成する必要があります。
この変換後にあなたのウェブサイトに表示·
される場合、それはブラウザにあなたのコンテンツが Windows-1252 または ISO-8859-1 などであることを伝えていることを意味します。あなたのコンテンツが UTF-8 であることをブラウザーに伝える必要があります:
header("Content-Type: text/html; charset=utf-8");