'£'
HTML エンティティを人間が読める形式、たとえば「£」、'°'
「°」などに変換したいと考えています。
この質問に関するいくつかの投稿を読みました
Python 2.x を使用して HTML ソース コンテンツを読み取り可能な形式に変換する
Python文字列でHTMLエンティティをデコードしますか?
Python で XML/HTML エンティティを Unicode 文字列に変換する
彼らによると、文書化されていない関数 unescape() を使用することにしましたが、うまくいきません...
私のコードサンプルは次のようなものです:
import HTMLParser
htmlParser = HTMLParser.HTMLParser()
decoded = htmlParser.unescape('© 2013')
print decoded
この python スクリプトを実行すると、出力は次のようになります。
© 2013
それ以外の
© 2013
私は Python 2.X を使用しており、Windows 7 と Cygwin コンソールで作業しています。私はグーグルで検索しましたが、同様の問題は見つかりませんでした..誰かが私を助けてくれますか?