問題タブ [nextsibling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
288 参照

python - データフレーム内のh4をdiv兄弟にマップするBeautifulsoup python

Web ページをスクレイピングしていますが、情報をデータフレームにマッピングするのに問題があります。HTML にテーブルはありません。HTML の例を次に示します。

PythonでリクエストとBeautifulsoupを使用したコードは次のとおりです。

データフレームは、1 つのイベント タイトルと 2 つのリストのようになります。

h4 カテゴリ 1 が div A に関連付けられるように、何らかの形でマッピングしてほしいと思います。

h4 と div は親子ではなく兄弟であるため、Web スクレイプ コードでこれを分離することは可能ですか? イベントのタイトルが異なる複数のページがあり、データが大きすぎて手作業ではできません。

とりわけ、私も試しました:

この結果から、次の df が得られます。

要素を調べるためのウェブリンクは次のとおりです: https://www.ibjjfdb.com/ChampionshipResults/926/PublicResults

どんなアイデアでも役に立ちます。ありがとうございました!

0 投票する
1 に答える
130 参照

python - 次の兄弟だけがタグを期待しているかどうかを確認できますか?

最初にスクレイピングしたい html の一部を投稿させてください

順番にある画像の p と src のテキストをスクレイピングしようとしていますimage_urlp問題は、上で示したhtmlは実際には静的centerではなく、すべてのページが異なる構造を持っているということです。img src

pcenterタグは各ページでランダムに構成されているため、すべてのタグを取得することを考えてpいました。もしそうなら、それを追加してください。response.css('#hello p')ppcentersrc

p.xpath('following-sibling::center[1]/img/@src').get()p は反復中の各段落であるため、そのようなものを見つけました。

しかし、次の兄弟を見つけるだけでなく、その後すべての兄弟を調べてタグが一致するかどうかを確認するため、実際に4を取得するpまで4つのタグがあるとしましょう。centerimg srcp.xpath('following-sibling::center[1]/img/@src').get()center

グーグルを試しましたが、次の兄弟がタグであるかどうかのみを確認することについて言及しているものはありません。データを順番に保存できるように、それを機能させることができると誰でも思いますか?

うまくいけば、私の説明は理にかなっています。

事前に助けと提案をありがとう

0 投票する
1 に答える
150 参照

python - 次の兄弟で xpath を検索し、Python Selenium でテキストを含む

follow-siblings の使用の基本は知っていますが、ここではもう少し複雑に見える状況があります。

ヘッダーがTotal gamesであるテキストTotal 6.5の要素を見つけたいです。次の兄弟でテキストを含むにはどうすればよいですか?