2

feedparser を使用してフィードから特定の情報を取得しようとしていますが、各エントリの生の XML (つまり、RSS と Atom の要素) も取得しようとしていますが、その方法がわかりません。もちろん、XML を手動で解析することもできますが、これはあまり洗練されたものではなく、RSS と Atom を別々にサポートする必要があり、不適切な形式のフィードの場合は feedparser と同期しなくなる可能性があると思います。より良い方法はありますか?

ありがとう!

4

1 に答える 1

2

私は feedparser の現在の開発者です。現在、その情報を取得する方法の 1 つは、monkeypatch を使用feedparser._FeedParserMixinする (または feedparser.py のローカル コピーを編集する) ことです。変更するメソッドは次のとおりです。

  • feedparser._FeedParserMixin.unknown_starttag
  • feedparser._FeedParserMixin.unknown_endtag

各メソッドの先頭に、独自のルーチンへのコールバックを挿入できます。このルーチンは、feedparser が検出した要素とその属性をキャプチャします。

于 2011-11-05T15:27:55.757 に答える