XpathBuilderを使用すると、単純な検索エンジン クエリを作成し、XPath を使用して検索結果からデータを引き出すことができます。さまざまな検索エンジンでクエリ「XPath チュートリアル」を実行し、各検索エンジンが返す結果の数を抽出しようとする、 Google Doc スプレッドシートの簡単な例をいくつか示します。
その Google Doc のコードは次のとおりです。
=importxml("http://www.google.com/search?q="xpath+tutorial"&num=30&pws=0",
"//div[@id='resultStats']")
=importxml("http://www.bing.com/search?q=xpath+tutorial&count=30",
"//span[@class='sb_count']")
=importxml("http://search.yahoo.com/search?p=xpath+tutorial&n=30",
"//span[@id='resultCount']")
これについては、私には理解できない奇妙な点がいくつかあります。まず、Google 検索では結果が返されませんが、XPath クエリは問題ないようです。実際、私がここで行ったことを正確に推奨する多くのオンライン チュートリアルがあります。
Yahoo クエリは正しい結果を返します。これだけが正しい結果を返します。
XPath クエリに一致する XML ノードが 1 つしかないにもかかわらず、Bing Xpath クエリによって検出された結果の数が、Bing Web ページに表示される結果と一致しません。詳細はこちらのスプレッドシートに記載されています
それはどこでそんなにうまくいかなかったのですか?