Googleカスタム検索APIのドキュメント(http://code.google.com/apis/customsearch/docs/start.html#sites)によると、検索できるサイトは最大5000に制限されています。これはかなりラメです。Googleの結果を使用してWeb全体を検索できるようにする方法はありますか?
また、5000を超えるWebサイトに一致する一連のURLパターンを含める場合、APIはどのサイトを含め、どのサイトを除外するかをどのように選択しますか?
Googleカスタム検索APIのドキュメント(http://code.google.com/apis/customsearch/docs/start.html#sites)によると、検索できるサイトは最大5000に制限されています。これはかなりラメです。Googleの結果を使用してWeb全体を検索できるようにする方法はありますか?
また、5000を超えるWebサイトに一致する一連のURLパターンを含める場合、APIはどのサイトを含め、どのサイトを除外するかをどのように選択しますか?
これはカスタム検索用であり、通常のGoogle検索用ではありません。たとえば、abc.comとacme.comを所有している場合は、これら2つのドメインで顧客のカスタム検索を設定できます。そうすれば、彼らはあなたのサイトで情報を検索することができます。5,000サイトの制限は実際には巨大です。その多くの指定されたサイトを使用するアプリケーションを考えることができるかどうかはわかりません。
あなたが探しているのは、Google全体を検索したGoogle WebSearchAPIだと思います。残念ながら、それは現在減価償却されています。(参照:http ://code.google.com/apis/websearch/ )古いAPIは引き続き使用できますが、Googleはいつでもオフにする権利を留保しているため、リスクがあります。また、1日に実行する検索の数も制限されます(ただし、その制限の具体的な数は見つかりません)。これらの用語へのリンクは次のとおりです: http ://code.google.com/apis/websearch/terms.html
本当にコードに直接統合したい場合は、別の検索エンジンのAPIを調べることをお勧めします。別の提案は、検索情報をインターフェースの背後に置き、今のところGoogleにコーディングすることです。次に、オフにするか、より良いものが出てきた場合は、検索コードだけを変更して、最新で最高のAPIを指すようにすることができます。
設定は明らかではありませんが、Googleカスタム検索は実際にはウェブ全体を検索することができます。「Web全体を検索する」を参照してください。
発生する可能性のあるその他の問題は次のとおりです。
残念ながら、Googleサイト検索に「アップグレード」すると、ウェブ全体を検索できるという犠牲を払って問題2が解消されます。
リンクされた仕様のCSEファイルを自分のWebサイト https://www.google.com/cse/docs/cref.htmlでホストしている場合は、 5000の制限を超えることができます。