Python を使用して別のエンコーディングで Web 応答を受信しています。期待される出力は、Web ページで指定されたものと同じでなければなりません。
例:マーク・バルベ
最後の文字は、html 応答の解析後も同じままである必要があります。
現在、私はこれに次のコードを使用しています
unicode.join(u'\n',map(unicode,item))
特別なエンコーディングが指定されていない場合、次のエラーがスローされることがあります: 例: Markus Rygaard、Alberte Blichfeldt、Flemming Quist、Møller
Traceback (most recent call last):
File "BFICrawl.py", line 20, in <module>
print attrName + " : " + attrValue
File "C:\Python27\LIB\encodings\cp437.py", line 12, in encode
return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\xf8' in position 6
0: character maps to <undefined>
私は本当に同じ理由を見つけることができません。Web から同じエンコード コンテンツを取得する別の方法はありますか。