1

ドメインから一連のリンクとコンテンツをスケープバックしようとしています。

グーグルのクエリは

"site:www.newswebsite.com search_term"

これを機能させるのに近いものを見てきましたが、Webサイト全体で検索を機能させてから、検索語でフィルタリングすることはできないようです。

これはカスタムデータテーブルなしで可能ですか?

4

2 に答える 2

2

とうとう底にたどり着きました。

select title,abstract,url,date from search.web(0) where query="search_term" and sites="www.website1.com,www.website2.com,www.website3.com" | sort (field='date') | reverse()

これは、3 つのサイト、日付順、および新しい順で検索します。並べ替えを逆にする別の方法がありますが、これは今のところうまくいくようです。私はそれがソート内で降順= trueだと思います(field = 'date'、descending = 'true')

自分で言うのもなんですが、とても参考になります。

于 2009-12-22T15:28:24.163 に答える
0

Christian Heilmann は、24ways Web サイトで、YQLと HTML データソースから情報を取得することについて、かなり優れた記事を書きました。

于 2009-12-21T14:30:56.943 に答える