1

ウィキペディアから Google スプレッドシートにデータを取得するために使用する正しい Xpath クエリは何ですか?

これをテストしたい例を次に示します。

ウィキペディアのページ: http://en.wikipedia.org/wiki/12_Angry_Men_(1957_film)

プルするデータ: 右側の表にある「96 分」の「実行時間」の値

方法: Google スプレッドシートの ImportXML 関数を使用

次のことを試しましたが、N/A が返されます。

=IMPORTXML("http://en.wikipedia.org/wiki/12_Angry_Men_(1957_film)", "//div[normalize-space() = 'Running time']/following-sibling::td")

ありがとう!

4

1 に答える 1

0

XPath にはいくつかの問題があります。

「Running time」の後にあるのはその親の兄弟であるため、軸はそのfollowing-siblingページのマークアップでは機能しません。代わりに、ノード タイプ セレクターで軸を使用します。ただし、それはまだ選択された の後のすべてのノードを返すため、さらに最初のノードのみを選択する述語が必要です: 。tddivthfollowingfollowing::tdtddiv[1]

XPath を使用して関数を完成させます。

=IMPORTXML("http://en.wikipedia.org/wiki/12_Angry_Men_%281957_film%29", "//div[normalize-space()='Running time']/following::td[1]")
于 2015-03-28T22:03:35.903 に答える