file_txt = urllib.request.urlopen("ftp://ftp.sec.gov/edgar/data/1220985/0000930413-12-003922.txt")
file = file_txt.read().decode('cp1252')
soup = BeautifulSoup(file)
print(soup.prettify())
#UnicodeEncodeError: 'charmap' codec can't encode character '\x92' in position 11900: character maps to <undefined>
txtファイルを確認しました。ブラウザで表示すると、\x92
実際には の HTML エンティティとして表示され’
ます'
。ブラウザと同じエンコーディング スキーム ( ) を使用してデコードした後、エラーが発生する理由がわかりませんcp1252
。