特定のタイプのファイルへのリンクのみが返されるように、結果を制限できるyahooのプログラム検索に使用できるパラメーターがあるかどうかは誰にもわかりません(たとえばPDFなど)。GUIでそれを行うことは可能ですが、APIを介してそれを実現するにはどうすればよいですか?
Python のサンプル コードを提供していただけると非常に助かりますが、他の解決策も役立つ可能性があります。
特定のタイプのファイルへのリンクのみが返されるように、結果を制限できるyahooのプログラム検索に使用できるパラメーターがあるかどうかは誰にもわかりません(たとえばPDFなど)。GUIでそれを行うことは可能ですが、APIを介してそれを実現するにはどうすればよいですか?
Python のサンプル コードを提供していただけると非常に助かりますが、他の解決策も役立つ可能性があります。
これが私がこの種のことをすることです。より多くのパラメーターが公開されるため、ニーズに合わせて調整できます。これにより、クエリ「resume」から最初の 10 個の PDF URL が出力されます [私のものはそれらの 1 つではありません ;) ]。これらの URL は好きなようにダウンロードできます。
クエリから返される json ディクショナリは少し大雑把ですが、これで作業を開始できます。実際のコードでは、辞書内のいくつかのキーが存在するかどうかを確認する必要があることに注意してください。結果がない場合、このコードはおそらく例外をスローします。
Tiago が提供したリンクは、「type」パラメーターでサポートされている値を知るのに役立ちます。
from yos.crawl import rest
APPID="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
base_url = "http://boss.yahooapis.com/ysearch/%s/v%d/%s?start=%d&count=%d&type=%s" + "&appid=" + APPID
querystr="resume"
start=0
count=10
type="pdf"
search_url = base_url % ("web", 1, querystr, start, count, type)
json_result = rest.load_json(search_url)
for url in [recs['url'] for recs in json_result['ysearchresponse']['resultset_web']]:
print url