python - ユニバーサルフィードパーサーに関する質問

Question

クロールしたいくつかのブログフィードからコンテンツを取得する際に問題が発生しました。

理由はわかりませんが、feedparser で 1 つまたは 2 つのブログを解析すると、次の特定のエラーが返されます。

results = feedparser.parse(url)

  ent = []

  for entry in results.entries:
     e = {}
     e['title'] = entry.title
     e['content'] = entry.content[0].value

オブジェクトには属性「コンテンツ」がありません

また

オブジェクトには属性「リンク」がありません

これは、私の他のブログの残りの部分には当てはまりません。空のエントリコンテンツはこれになりますか?

score 1 · Accepted Answer

フィードで使用される XML タグと、feedparser のエントリで使用可能な属性の間にはマッピングがあります。問題を引き起こしているフィードの 1 つのソースを表示し、使用されているタグを確認します。エントリのコンテンツが含まれていないか、リンクがuidではなくのようなフィールドにあることに気付くかもしれませんlink。

次に、try/を使用するかcatch、hasattr.

問題のフィードの 1 つへのリンクを投稿していただければ、さらにアドバイスを提供できるかもしれません。

python - ユニバーサル フィード パーサーに関する質問

1 に答える 1

Related

Reference

python - ユニバーサルフィードパーサーに関する質問