CGI を使用print()
するには、出力用に正しいコーデックが設定されている必要があります。print()
特定のエンコーディングで書き込み、開かsys.stdout
れsys.stdout
ています。その決定方法はプラットフォームに依存し、スクリプトの実行方法によって異なる場合があります。スクリプトを CGI スクリプトとして実行すると、どのエンコーディングが使用されるかほとんどわからなくなります。
あなたの場合、Web サーバーはテキスト出力のロケールを UTF-8 以外の固定エンコーディングに設定しています。Python はそのロケール設定を使用してそのエンコーディングで出力を生成します。<meta>
ヘッダーがない場合、ブラウザーはそのエンコーディングを正しく推測します (またはサーバーが Content-Type ヘッダーで<meta>
それを伝えています)。生成されたデータに対して正しくないエンコーディング。
sys.stdout.buffer
明示的に UTF-8 にエンコードした後、 に直接書き込むことができます。これを簡単にするヘルパー関数を作成します。
import sys
def enc_print(string='', encoding='utf8'):
sys.stdout.buffer.write(string.encode(encoding) + b'\n')
enc_print("Content-type:text/html")
enc_print()
enc_print("""
<!doctype html>
<html>
<head>
<meta charset="UTF-8">
</head>
<body>
şöğıçü
</body>
</html>
""")
別のアプローチは、必要なコーデックを使用sys.stdout
する新しいio.TextIOWrapper()
オブジェクトに置き換えることです。
import sys
import io
def set_output_encoding(codec, errors='strict'):
sys.stdout = io.TextIOWrapper(
sys.stdout.detach(), errors=errors,
line_buffering=sys.stdout.line_buffering)
set_output_encoding('utf8')
print("Content-type:text/html")
print()
print("""
<!doctype html>
<html>
<head></head>
<body>
şöğıçü
</body>
</html>
""")