そのため、ISO-8859-1 エンコーディングを使用するサイトを取得しましたが、それを変更することはできません。サイトの Web アプリに入力したコンテンツが正しく解析されるようにしたいと考えています。パーサーは、文字単位で機能します。また、パーサーを変更することもできません。パーサーが処理するファイルを作成しているだけです。解析後に表示するようにアプリに指示しているファイルのコンテンツには、Unicode 文字が含まれています (または、CP437 にマップされた Windows Alt コードによって生成されたものであっても、少なくともそう仮定します)。パーサーの文字ごとの操作のため、エンティティを使用することはできません。パーサーが出力時にエスケープする唯一の文字は、アンパサンド、小なり記号、大なり記号などのマークアップに依存する文字です。先に進んでこれを実行して、どのように見えるかを確認しますが、出力は出版物でしか見ることができません。
要するに、サイトに、ISO-8859-1 を使用することになっていることを示すメタ タグが付いたサイトで ▼ÇÑ¥☺☻ を出力するように指示した場合、ブラウザは Unicode を自動検出して表示しますか?文字通り ISO-8859-1 として変換し、別の文字セットを取得しますか?
更新: http://doorstop.csh.rit.edu/home/testingに一時的なテスト サイトを作成しました。このサイトでは、BOM なしで UTF-8 を使用して Notepad++ でテスト ファイルを作成しましたが、エンコーディングを ISO に設定するメタ タグを使用しました。 -8859-1.