feedparser を使用してフィードから特定の情報を取得しようとしていますが、各エントリの生の XML (つまり、RSS と Atom の要素) も取得しようとしていますが、その方法がわかりません。もちろん、XML を手動で解析することもできますが、これはあまり洗練されたものではなく、RSS と Atom を別々にサポートする必要があり、不適切な形式のフィードの場合は feedparser と同期しなくなる可能性があると思います。より良い方法はありますか?
ありがとう!
feedparser を使用してフィードから特定の情報を取得しようとしていますが、各エントリの生の XML (つまり、RSS と Atom の要素) も取得しようとしていますが、その方法がわかりません。もちろん、XML を手動で解析することもできますが、これはあまり洗練されたものではなく、RSS と Atom を別々にサポートする必要があり、不適切な形式のフィードの場合は feedparser と同期しなくなる可能性があると思います。より良い方法はありますか?
ありがとう!
私は feedparser の現在の開発者です。現在、その情報を取得する方法の 1 つは、monkeypatch を使用feedparser._FeedParserMixin
する (または feedparser.py のローカル コピーを編集する) ことです。変更するメソッドは次のとおりです。
feedparser._FeedParserMixin.unknown_starttag
feedparser._FeedParserMixin.unknown_endtag
各メソッドの先頭に、独自のルーチンへのコールバックを挿入できます。このルーチンは、feedparser が検出した要素とその属性をキャプチャします。