私はBeautifulSoup(BS4)を使用して最初のパーサーを作成しようとしており、概念的な問題にぶつかっていると思います。私はPythonをあまり使っていません-私はPHPがはるかに得意です。
BeautifulSoupで必要なテーブルを見つけることができますが、テーブルに足を踏み入れてすべての行を見つけようとすると、次のようなバリエーションがあります。
AttributeError: 'ResultSet' object has no attribute 'attr'
urllib2を使用してPythonで開いたURLから特定のデータを引き出すにはどうすればよいですか?でサンプルコードをウォークスルーしてみました。ほぼ同じエラーが発生しました(注:試してみたい場合は、有効なURLが必要です)。
私が読んでいることのいくつかは、問題はResultSetがリストであるということだと言っています。どうすればそれを知ることができますか?私がそうするならprint type(table)
それはただ私に言う<class 'bs4.element.ResultSet'>
私は次のような表のテキストを見つけることができます:
for row in table:
text = ''.join(row.findAll(text=True))
print text
しかし、私がHTMLを検索しようとすると、次のようになります。
for row in table:
text = ''.join(row.find_all('tr'))
print text
それではexpected string, Tag found
、この文字列(HTMLでいっぱいの文字列)を解析可能な美しいスープオブジェクトに戻すにはどうすればよいですか?