問題タブ [nextsibling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - データフレーム内のh4をdiv兄弟にマップするBeautifulsoup python
Web ページをスクレイピングしていますが、情報をデータフレームにマッピングするのに問題があります。HTML にテーブルはありません。HTML の例を次に示します。
PythonでリクエストとBeautifulsoupを使用したコードは次のとおりです。
データフレームは、1 つのイベント タイトルと 2 つのリストのようになります。
h4 カテゴリ 1 が div A に関連付けられるように、何らかの形でマッピングしてほしいと思います。
h4 と div は親子ではなく兄弟であるため、Web スクレイプ コードでこれを分離することは可能ですか? イベントのタイトルが異なる複数のページがあり、データが大きすぎて手作業ではできません。
とりわけ、私も試しました:
この結果から、次の df が得られます。
要素を調べるためのウェブリンクは次のとおりです: https://www.ibjjfdb.com/ChampionshipResults/926/PublicResults
どんなアイデアでも役に立ちます。ありがとうございました!
python - 次の兄弟だけがタグを期待しているかどうかを確認できますか?
最初にスクレイピングしたい html の一部を投稿させてください
順番にある画像の p と src のテキストをスクレイピングしようとしていますimage_url
。p
問題は、上で示したhtmlは実際には静的center
ではなく、すべてのページが異なる構造を持っているということです。img src
p
とcenter
タグは各ページでランダムに構成されているため、すべてのタグを取得することを考えてp
いました。もしそうなら、それを追加してください。response.css('#hello p')
p
p
center
src
p.xpath('following-sibling::center[1]/img/@src').get()
p は反復中の各段落であるため、そのようなものを見つけました。
しかし、次の兄弟を見つけるだけでなく、その後すべての兄弟を調べてタグが一致するかどうかを確認するため、実際に4を取得するp
まで4つのタグがあるとしましょう。center
img src
p.xpath('following-sibling::center[1]/img/@src').get()
center
グーグルを試しましたが、次の兄弟がタグであるかどうかのみを確認することについて言及しているものはありません。データを順番に保存できるように、それを機能させることができると誰でも思いますか?
うまくいけば、私の説明は理にかなっています。
事前に助けと提案をありがとう
python - 次の兄弟で xpath を検索し、Python Selenium でテキストを含む
follow-siblings の使用の基本は知っていますが、ここではもう少し複雑に見える状況があります。
ヘッダーがTotal gamesであるテキストTotal 6.5の要素を見つけたいです。次の兄弟でテキストを含むにはどうすればよいですか?