SOに関する私の最初の質問:-)
背景: HTTP トラフィックをフィルタリングする必要があるソフトウェアに取り組んでいます。POST リクエストの内容を確認する必要がある部分に取り組んでいるときに、受け取ったデータを charset に関してどのように解釈するかという問題が発生しました。
私のコードが「Content-Type」ヘッダーで受け入れる必要がある文字セット名を知るために、最初に文字セット名の完全なリストを探し、これを見つけました: http://www.iana.org/assignments/character-sets
(もちろん、そのリストはすべてをサポートするには長すぎるので、私の場合に関連する小さなサブセットを選択します。)
質問:リストから、「UTF8」(ダッシュなし) は IANA 定義の文字セットの名前ではないと思いますが、それでも時々使用され、ほとんどのサーバー/ブラウザーが理解できるようです。私のフィルターが理解できるはずの、IANA によってリストされていない、一般的に理解されている文字セット名のようなケースは他にありますか?
一般的に:「より完全な」リストはどこかにありますか?
より具体的には、IANA によってリストされていない US-ASCII 文字セットのエイリアスはありますか?