バグに違いないと思ったので、ここでバグレポートを発行しました。一方、何かが欠けている可能性があるため、コードをもう一度確認する必要があります。
問題は、.xhtml ファイルの内容で BeautifulSoup を初期化すると、xml 定義の末尾に 2 つの疑問符が表示されることです。
問題を再現できますか?それを回避する方法はありますか?関数、メソッド、引数などが不足していますか?
Edit0: Python 2.x の BeautifulSoup 4 です。
Edit1:なぜ反対票を投じるのですか?
問題:
<?xml version="1.0" encoding="UTF-8"??>
端末出力:
>>> from bs4 import BeautifulSoup as bs
>>> with open('example.xhtml', 'r') as f:
... txt = f.read()
... soup = bs(txt)
...
>>> print txt
<?xml version="1.0" encoding="UTF-8"?>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="utf-8"/>
</head>
<body>
</body>
</html>
>>> print soup
<?xml version="1.0" encoding="UTF-8"??>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="utf-8"/>
</head>
<body>
</body>
</html>