したがって、次の形式のデータがあります。
<Category: XXX -
また
<Category: XXX</b>
'xxx' のみを保持したいのですが、('XXX','') または ('') またはその他の望ましくないバリエーションしか保持できませんでした。
美しいスープを使いたくありません。anaconda パッケージ マネージャーでダウンロードするのに問題があります。
追加 - 私の試み
'Category: ([^<]+)</b'
['xxx'] を生成する場合
<Category: XXX</b>
'Category: ([^<]+) &n'
['xxx'] を生成する場合
<Category: XXX
そして、私は次のようなことをしたと思います
'Category: ([^<]+)(</b| &n)'
それがもたらした
[('XXX', '</b')]
また
[('XXX', ' &nb')]