1

多数のCSVファイルから大量のデータをキャプチャしました。特定の情報が刻まれています。私が切り出したセクションの1つは、さまざまなテキスト形式が大量にあるセクションです。これらのいくつかは、感情やその他の非標準的なテキストです。

このデータをHTML形式で出力すると、エラーが発生しました。現在、次のエラーがあります。

UnicodeDecodeError:'charmap'コーデックはPosition:文字マップのバイト0X90を<undefined>にデコードできません。

プログラムは現在、文字列から配列に情報を格納しています。次に、配列がHTMLファイルに書き込まれます。

Python 3.2でこの問題を克服する方法、または文字バッファを実装する方法について何か考えはありますか?

アップデート

私は以下のコメントを試し、さらに調査を行いました。

私はこのコードを無駄に使用しました:

MessageArray.append(Message.encode('ascii', 'ignore'))

しかし、エラーが発生しました:TypeError:'bytes'オブジェクトを暗黙的にstrに変換できません。

4

1 に答える 1

0

@SilverbackNet のコメントに従って問題を解決できました。これは、CSV から未加工のバイナリ データをインポートして変換できるという全体的な問題を解決しませんでしたが、問題を引き起こしたデータを無視することができました。

于 2012-08-03T07:04:24.443 に答える