問題タブ [gb2312]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - html から中国語の表をダウンロードした後の奇妙な文字
MAC OS X 10.12 システムを使用しています。http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2011/51/06/81/510681114.htmlからテーブルをダウンロードしました 。テーブルは GB2312 でエンコードされていますが、GBK を使用してテーブルを保存しました。コードの主要部分は次のようになります。
他の多くの同様のテーブルでこのコード パターンを繰り返しましたが、一部のリンク (ここに投稿したものなど) では、ダウンロードされた中国語のテーブルに奇妙な文字が含まれています。これが例です。
このテーブルを実際の中国語に変換するにはどうすればよいですか、または中国語のテーブルをダウンロードするにはどうすればよいですか?
問題は、GB2312 を使用することを選択した場合、おそらくこのテーブルでは中国語で正しく表示される可能性がありますが、他のテーブルではこれらの厄介な奇妙な文字が引き続き表示されることです。