python - Python-'ascii'コーデックはバイトをデコードできません

Question

Python2.6とJinja2を使用してHTMLレポートを作成しています。テンプレートに多くの結果を提供すると、テンプレートはそれらをループしてHTMLテーブルを作成します

template.renderを呼び出すと、突然このエラーが発生し始めました。

<td>{{result.result_str}}</td>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in range(128)

奇妙なことに、result.result_strをすべての結果に対して「abc」のような単純なASCII文字列に設定しても、このエラーが引き続き表示されます。私はJinja2とPythonを初めて使用するので、問題を調査して根本的な原因を突き止める方法についてアイデアをいただければ幸いです。

score 78 · Accepted Answer

これを追加してみてください：

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

それは私の問題を解決しました、幸運。

score 43 · Accepted Answer

http://jinja.pocoo.org/docs/api/#unicodeから

Jinja2は内部でUnicodeを使用しています。つまり、Unicodeオブジェクトをレンダリング関数またはASCII文字のみで構成されるバイト文字列に渡す必要があります。

したがって、result.result_strを設定する場合は常に、それをユニコードにする必要があります。

result.result_str = unicode(my_string_variable, "utf8")

（バイトがutf8でエンコードされたUnicodeの場合）

また

result.result_str = u"my string"

score 20 · Accepted Answer

「ABC」のような文字列でエラーが発生した場合は、ASCII以外の文字が別の場所にある可能性があります。テンプレートソースではおそらく？

いずれの場合も、この種の問題を回避するために、アプリケーション全体でUnicode文字列を使用してください。データソースがバイト文字列を提供しているbyte_string.decode('utf-8')場合、文字列がUTF-8でエンコードされていれば、でユニコード文字列を取得します。ソースがファイルの場合はStreamReader、コーデックモジュールのクラスを使用します。

Unicode文字列と通常の文字列の違いがわからない場合は、http：//www.joelonsoftware.com/articles/Unicode.htmlをお読みください。

score 11 · Accepted Answer

Jinja2からの出力をHTMLファイルに保存するコードで同じ問題が発生しました。

with open(path, 'wb') as fh:
    fh.write(template.render(...))

Jinja2のせいにするのは簡単ですが、実際の問題は、open()バージョン2.7の時点でUTF-8をサポートしていないPythonにあります。修正は次のように簡単です。

import codecs
with codecs.open(path, 'wb', 'utf-8') as fh:
    fh.write(template.render(...))

score 5 · Accepted Answer

単純な文字列にはUTF-8文字バイトが含まれる場合がありますが、Unicode型ではありません。これは、strをunicodeに変換する「decode」によって修正できます。Python2.5.5で動作します。

my_string_variable.decode（ "utf8"）

score 0 · Accepted Answer

ASCIIは7ビットコードです。値0xC4は7ビットに格納できません。したがって、そのデータに間違ったエンコーディングを使用しています。

score -1 · Accepted Answer

またはあなたはするかもしれません

export LANG='en_US.UTF-8'

スクリプトを実行するコンソールで。

python - Python-'ascii'コーデックはバイトをデコードできません

7 に答える 7

Related

Reference