これらのコードでいっぱいのファイルを取得したので、それを通常の文字 (つまり、ファイル全体) に「変換」したいと考えています。どうすればいいですか?
事前にどうもありがとうございました。
これらのコードでいっぱいのファイルを取得したので、それを通常の文字 (つまり、ファイル全体) に「変換」したいと考えています。どうすればいいですか?
事前にどうもありがとうございました。
元々、8 ビット エンコーディング (例: ISO-8859-15 ) として解釈され、エンティティ エンコードされた UTF-8 ファイルがあったようです。私がこれを言うのは、シーケンス C3A9 が非常にもっともらしいUTF-8 エンコーディング シーケンスのように見えるからです。
最初にエンティティ デコードする必要があります。次に、UTF-8 エンコーディングを再度取得します。次に、iconvなどを使用して、選択したエンコーディングに変換できます。
例を実行するには:
これを PHP で処理したいとおっしゃいましたが、次のような処理が必要になる場合があります。
//to load from a file, use
//$file=file_get_contents("/path/to/filename.txt");
//example below uses a literal string to demonstrate technique...
$file="&Précédent is a French word";
$utf8=html_entity_decode($file);
$iso8859=utf8_decode($utf8);
//$utf8 contains "Précédent is a French word" in UTF-8
//$iso8859 contains "Précédent is a French word" in ISO-8859