HTML ファイルから一部のデータを取り除こうとしています。正しいセルを取得するためのロジックをコーディングしました。今、「セル」の実際の内容を取得するのに苦労しています:
ここに私のHTMLスニペットがあります:
headerRows[0][10].contents
[<font size="+0"><font face="serif" size="1"><b>Apples Produced</b><font size="3">
</font></font></font>]
これは Python [] のリスト項目であることに注意してください。
Apples Produced の値が必要ですが、取得できません。
任意の提案をいただければ幸いです
これを説明する良い本についての提案は、私の永遠の感謝を得るでしょう
その答えをありがとう。ただし、より一般的な答えはありません。セルにボールド属性がない場合
次のように言います。
[<font size="+0"><font face="serif" size="1"><I>Apples Produced</I><font size="3">
</font></font></font>]
りんごの生産量
私はドキュメントを読んだり理解したりすることを学ぼうとしています。あなたの回答が役に立ちます
このヘルプに本当に感謝しています。これらの回答の最も良い点は、それらから一般化するのがはるかに簡単であることです。その後、BeautifulSoup のドキュメントから一般化することができました。私は Fortran 時代にプログラミングを学び、現在は Python を学んでおり、その力に驚かされています。BeautifulSoup はその一例です。一貫性のあるドキュメント全体を作成することは、私にとって大変なことです。
乾杯