0

Python を使用して、ウィキペディアの API からページを取得し、そのページをファイルに出力しようとしています。

json_data = json.loads(issue_request(params_html))
document = json_data['parse']['text']['*'].encode('utf-8')
a = open('test.html', 'wb')
a.write(document)

私が発行しているリクエストはhttp://pt.wikipedia.org/w/api.php?action=parse&prop=text&page=Dia_dos_Namorados&format=jsonです

問題は、ブラウザで「test.html」を開くと、アクセント付きの文字がすべて正しくレンダリングされないため、Dia de São Valentim のように表示されることです。

「latin-1」へのエンコーディングやコーデックの使用など、あらゆる種類のエンコーディング スキームを試しましたが、これまでのところうまくいきませんでした。興味深いことに、ファイルをテキスト エディター (崇高な) で開くと、アクセント付きの文字が正常に表示されます。彼らが面白く見えるのはブラウザだけです。

4

1 に答える 1