2

プロプライエタリ データの検索に使用する検索エンジン (DtSearch、Lucene.net、Sphinx、Google など) の主な違いは何ですか?

検索対象のデータは、名前と値のペアの形式のメタデータでマークアップされたプレゼンテーションのないデータで構成されます。さまざまなツールのフォーマット解析機能には関心がありません。また、検索結果は、他の (同様に構造化されたリポジトリ.

決定を通知する必要があるいくつかの関連する検索エンジンの特性を以下に示します。さらなる提案や経験の説明を歓迎します。

• コスト • 使いやすさ • 特定のタグのみを返すように構成できます • 特定の用語を「識別」して、検索結果にこれらの結果の重み付けを高くすることができます • 検索結果または %E6 レコード/ドキュメントを返すのに 0.3 秒未満の高速 • タイプ付きのタグをサポートします(find weather='sunny' but not person=sunny) • 関連性ランキングを与える重み付けをサポート • 関連性によってランク付けされた順序で結果を返す • シノニムをサポート • ステミングをサポート • ストップ ワードをサポート • スペル修正をサポート • 並列化またはインデックス構築に対応 (インデックスベースの場合) • インデックスの再作成が速い (インデックスベースの場合) • インデックスの更新が速い (インデックスベースの場合) • 複数のインデックスからの結果を結合する (インデックスベースの場合) • 近接チェック: 近くにある単語に高い関連性を与える

4

2 に答える 2

2

私は、Solr と DataImportHandler が好きです。いくつかの XML 構成ファイルを編集することを気にしない限り、箇条書きのほとんどをサポートしており、セットアップはそれほど難しくありません。多くのエンタープライズ クラスの検索エンジンよりも簡単です。

GSA (Google 検索アプライアンス) に問題はありませんが、必要な制御の量を考えると、Solr の方が優れたオプションです。

ルセン/ソル

于 2008-11-21T05:10:06.777 に答える
1

関連性に関連して、Google検索アプライアンスは少し調整することができます。彼らは、あまりにも多くの調整を許可すると関連性が低くなると信じており、Googleは関連性を知っていると私は信じています。

ユーザーがGoogle以外の検索エンジンを使いやすいと感じることはまずありません。

于 2008-11-14T09:44:38.270 に答える