関連抽出の目的でテキストを取得するために、Java でプログラムによって Google にクエリを実行したいと考えています。
たとえば、Java で次のように記述します。
result_list=googleAgent.search("Berlin Germany");
ではresult_list
、「ベルリン」と「ドイツ」を含む文のリストを取得できます。次に、NLP 分析を実行して関係を抽出します。
全然できますか?もしそうならどうですか?
関連抽出の目的でテキストを取得するために、Java でプログラムによって Google にクエリを実行したいと考えています。
たとえば、Java で次のように記述します。
result_list=googleAgent.search("Berlin Germany");
ではresult_list
、「ベルリン」と「ドイツ」を含む文のリストを取得できます。次に、NLP 分析を実行して関係を抽出します。
全然できますか?もしそうならどうですか?
Google では、ウェブサイトから直接プログラムによる検索を行うことを禁止しています (そのため、Google には検索 APIがあります)。これをやろうとすると、Google は最終的にクライアントが解決しなければならないキャプチャをポップアップ表示します。したがって、OCR を実行している間に NLP を実行しようとします ;)
ただし、検索 API はそれほど優れていません。1 日あたりの特定のクエリ数 (100) と、結果ごとの情報に制限されています。
Google の Custom Search APIを使用できます