私はこの種のページから情報を取得しようとしています。
、、の下Internship
に含まれる情報が必要です。テーブルから値を抽出することはできますが、この場合、見出し(のような)がテーブルの外側のタグの下に単純なプレーンテキストとして存在し、その後、必要な値のテーブルが存在するため、使用するテーブルを決定できませんでした抽出します。そして、私はこの種のページをたくさん持っています、そして、いくつかのページがまったく存在しないかもしれないように、各ページがこれらの値を持っている必要はありません。(これにより、ページ内のテーブルの総数が減少します)。そのようなページの一例はこれです。このページにはまったく存在しません。Residency
Fellowship
Internship
div
Residency
Internship
私が直面している主な問題は、すべてのテーブルが同じ属性値を持っているため、異なるページにどのテーブルを使用するかを決定できないことです。関心のある値がページに存在しない場合は、その値に対して空の文字列を返す必要があります。
PythonでBeautifulSoupを使用しています。誰かが指摘できますか、どうすればそれらの値を抽出することができますか?