多数のhtmlテーブルからデータを取得するスクリプトを開発しようとしています。1つの問題は、列見出しを作成するための情報を含む行の数が不確定であるということです。ヘッダー行のセットの最後の行には、値を持つ各セルの属性border-bottomがあることがわかりました。したがって、属性border-bottomを持つセルを見つけることにしました。ご覧のとおり、リストを初期化しました。私は、borderCellsリストに含まれる各セルの親を見つけることを意図していました。ただし、このコードを実行すると、1つのセル、つまり属性border-bottomを持つallCellsの最初のセルがリストborderCellsに追加されます。参考までに、allCellsには193個のセルがあり、そのうち9個にはattrborder-bottomがあります。したがって、borderCellsリストに9つのメンバーが含まれることを期待していました。どんな助けでも大歓迎です。
borderCells=[]
for each in allCells:
if each.find(attrs={"style": re.compile("border-bottom")}):
borderCells.append(each)