私はPythonに非常に慣れていないため、この投稿が適切に書かれていない場合は、事前に謝罪してください。私がPython3とBeautifulSoupで抱えている非常に単純で愚かな問題。各行には複数のソースからの生データが含まれているため、各行のエンコーディングに何が含まれるかを知らずに、Python で CSV ファイルを解析しようとしています。ファイルを解析する前に、ファイルをクリーンアップするために BeautifulSoup を使用しています (これが良いアイデアかどうかはわかりません)。
from bs4 import BeautifulSoup
def main():
try:
soup = BeautifulSoup(open('files/sdk_breakout_1027.csv'))
except Exception as e:
print(str(e))
ただし、これを実行すると、次のエラーが発生します。
'ascii' コーデックは位置 287 のバイト 0xed をデコードできません: 序数が範囲内にありません (128)
私のトレースバックは、問題の原因として CSV の次の行を示しています。
500i(i£ : Android OS : 4.0.4
これについてもっと良い方法は何ですか?この CSV のすべての行を均一なエンコーディングに変換して、後で解析できるようにしたいだけです。
ご協力いただきありがとうございます。