3

ドキュメントには、デフォルトで許可/削除されるタグがリストされています。

http://www.feedparser.org/docs/html-sanitization.html

ただし、削除する追加のタグを指定する方法については何も述べていません。

Universal Feed Parserを使用してこれを行う方法はありますか、それとも独自の正規表現やBeautiful Soupなどを使用してさらに処理する必要がありますか?

4

1 に答える 1

6

コードをざっと見てみましたが、直接上書きする方法はないと思います。feedparser._HTMLSanitizer.acceptable_elementsただし、実行する前に削除されないタグのリストを上書きできますfeedparser.parse

于 2009-05-02T21:34:41.037 に答える