django - Pythonで正しくエンコードされていないスクレイピーデータ

Question

Pythonを使用したWebクロールにscrapyを使用しています。スクレイピング中に、「\xa0」、「\x0259」のように正しくエンコードされていない文字がいくつかあります。Pythonでそれらをどのように処理できますか?

score 1 · Accepted Answer

これらのような文字のすべてのインスタンスの前にu. たとえば、u'\xa0'とu'\x0259'. unicode-strings python docs は、これらの文字列と文字をエンコードおよびデコードするための他の方法も提供します。

1 に答える 1