私は周りを見回して、python 2.6以前の解決策しか見つけられませんでした。python 3.Xでこれを行う方法については何もありません。(私は Win7 ボックスにしかアクセスできません。)
私はこれを 3.1 で、できれば外部ライブラリなしで実行できる必要があります。現在、httplib2 がインストールされており、コマンド プロンプトの curl にアクセスできます (これが、ページのソース コードを取得する方法です)。残念ながら、curl は html エンティティをデコードしません。私が知る限り、ドキュメントでそれをデコードするコマンドを見つけることができませんでした。
はい、私は Beautiful Soup を動作させようとしましたが、3.X では何度も成功しませんでした。MS Windows環境のpython 3で動作させる方法について明示的な指示を提供できれば、非常に感謝しています。
つまり、明確にするために、次のような文字列を次Suzy & John
のような文字列に変換する必要があります: "Suzy & John".