HTMLドキュメントに次のテキストがあります:
<a href="#">�'ам интересна информация</a>
テキストを抽出するために次の式を使用しています。
row.xpath("string(./td[@class='col2 td-tags']/h3/a/text())")
この式は単純な英語では問題なく機能しますが、上記の文字列では次のエラーがスローされます。
'utf8' codec can't decode byte 0xd0 in position 0: invalid continuation byte