Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Pythonを使用したWebクロールにscrapyを使用しています。スクレイピング中に、「\xa0」、「\x0259」のように正しくエンコードされていない文字がいくつかあります。Pythonでそれらをどのように処理できますか?
これらのような文字のすべてのインスタンスの前にu. たとえば、u'\xa0'とu'\x0259'. unicode-strings python docs は、これらの文字列と文字をエンコードおよびデコードするための他の方法も提供します。
u
u'\xa0'
u'\x0259'