Content-Type ヘッダーに charset パラメータが指定されていない場合、RFC2616 セクション 3.7.1は、サブタイプ「テキスト」のメディア タイプに対して ISO8859-1 を想定する必要があることを暗示しているようです。
明示的な文字セット パラメータが送信者によって提供されない場合、「テキスト」タイプのメディア サブタイプは、HTTP 経由で受信したときにデフォルトの文字セット値「ISO-8859-1」を持つように定義されます。
「ISO-8859-1」またはそのサブセット以外の文字セットのデータは、適切な文字セット値でラベル付けする必要があります。
ただし、「application/x-javascript」のような Content-Type 値 (つまり、charset パラメータなし) を持つ Javascript ファイルを提供するアプリケーションを日常的に目にします。これらのスクリプトに非 ASCII UTF-8 文字が含まれている場合でも、解釈されると破損します。 ISO8859-1として。
これにより、クライアントに問題が発生することはないようです。クライアントはバイトを UTF-8 として解釈することをどのように認識しますか? UTF-8 がデフォルトであることを意味する他の文字データ サブタイプのルールはありますか? これはどこに文書化されていますか?