2 つのデータ項目を持つ辞書のリストを作成しようとしています。
私が見ているページには//div[@id='content']/*[self::p or self::h2]/a[2]
;に 37 件の一致があります。ただし、
//div[@id='content']/*[self::p or self::h2]/a[contains(@href,'game')]/img[@src]
2 つの xpaths have //div[@id='content']/*[self::p or self::h2]
in common には 33 の一致しかありません。2番目のxpathが一致する場合にのみ、最初のxpathに一致する要素を取得し、2番目の要素なしで4を残します。
これが xpath で達成できることを願っていますが、そうでない場合は、Python でこれを達成する関数を作成するためのアドバイスを使用できます。