私はhtmlを解析するためにbeautifulsoupを使用しようとしていますが、インラインスクリプトタグのページにアクセスするたびに、beautifulsoupはコンテンツをエンコードしますが、最後にデコードしません。
これは私が使用するコードです:
from bs4 import BeautifulSoup
if __name__ == '__main__':
htmlData = '<html> <head> <script type="text/javascript"> console.log("< < not able to write these & also these >> "); </script> </head> <body> <div> start of div </div> </body> </html>'
soup = BeautifulSoup(htmlData)
#... using BeautifulSoup ...
print(soup.prettify() )
私はこの出力が欲しい:
<html>
<head>
<script type="text/javascript">
console.log("< < not able to write these & also these >> ");
</script>
</head>
<body>
<div>
start of div
</div>
</body>
</html>
しかし、私はこの出力を得ます:
<html>
<head>
<script type="text/javascript">
console.log("< < not able to write these & also these >> ");
</script>
</head>
<body>
<div>
start of div
</div>
</body>
</html>