0

クロールしたいくつかのブログ フィードからコンテンツを取得する際に問題が発生しました。

理由はわかりませんが、feedparser で 1 つまたは 2 つのブログを解析すると、次の特定のエラーが返されます。

results = feedparser.parse(url)

  ent = []

  for entry in results.entries:
     e = {}
     e['title'] = entry.title
     e['content'] = entry.content[0].value

オブジェクトには属性「コンテンツ」がありません

また

オブジェクトには属性「リンク」がありません

これは、私の他のブログの残りの部分には当てはまりません。空のエントリ コンテンツはこれになりますか?

4

1 に答える 1

1

フィードで使用される XML タグと、feedparser のエントリで使用可能な属性の間にはマッピングがあります。問題を引き起こしているフィードの 1 つのソースを表示し、使用されているタグを確認します。エントリのコンテンツが含まれていないか、リンクがuidではなくのようなフィールドにあることに気付くかもしれませんlink

次に、try/を使用するかcatchhasattr.

問題のフィードの 1 つへのリンクを投稿していただければ、さらにアドバイスを提供できるかもしれません。

于 2010-06-22T09:33:41.283 に答える