0

関連するコンテンツをすばやく見つけられるように、Web サイト用の検索エンジンを構築したいと考えています。私はかなりの数の Google 検索を行い、ElasticSearch と Solr (どちらも Lucene の上にある)、および whoosh (python ベース) を発見しました。

しかし、これらの検索エンジンはすべて、データの上に「逆インデックス」を構築しているだけなのでしょうか? より質の高い検索を取得するための他のアルゴリズム的アプローチにはどのようなものがありますか?

関連する検索クエリを返す、Solr の上で協調フィルタリングを使用するこのブログ投稿に興味をそそられました。

http://www.opensourceconnections.com/2013/08/25/semantic-search-with-solr-and-python-numpy/

知っておくべき他の一般的なテクニックはありますか? ElasticSearch/Solr の上に他のライブラリがあり、プラグインして「そのまま」使用できますか?

リンクやヒントをいただければ幸いです。

4

5 に答える 5

0

Solr API を学習することをお勧めします。Solr API は 4、5 年前から開発されているため、関連する検索 API のような多くのプラグインを Solr で見つけることができます。しかし、エラスティック検索では、構成が非常に簡単ですが、非常に新しいエンジンなので必要です。より開発されます。

于 2013-09-09T10:57:46.520 に答える
0

Pyesは、十分に文書化された Elasticsearch 用の Python クライアントです。

また、このYoutube ビデオでは、Python で Elasticsearch を使用する方法の概要を説明しています。

于 2013-09-10T04:03:47.270 に答える
0

Google カスタム検索エンジンを使用することをお勧めします。ここで見てください。 https://www.google.com/cse/all

于 2013-09-10T09:46:19.750 に答える