プロプライエタリ データの検索に使用する検索エンジン (DtSearch、Lucene.net、Sphinx、Google など) の主な違いは何ですか?
検索対象のデータは、名前と値のペアの形式のメタデータでマークアップされたプレゼンテーションのないデータで構成されます。さまざまなツールのフォーマット解析機能には関心がありません。また、検索結果は、他の (同様に構造化されたリポジトリ.
決定を通知する必要があるいくつかの関連する検索エンジンの特性を以下に示します。さらなる提案や経験の説明を歓迎します。
• コスト • 使いやすさ • 特定のタグのみを返すように構成できます • 特定の用語を「識別」して、検索結果にこれらの結果の重み付けを高くすることができます • 検索結果または %E6 レコード/ドキュメントを返すのに 0.3 秒未満の高速 • タイプ付きのタグをサポートします(find weather='sunny' but not person=sunny) • 関連性ランキングを与える重み付けをサポート • 関連性によってランク付けされた順序で結果を返す • シノニムをサポート • ステミングをサポート • ストップ ワードをサポート • スペル修正をサポート • 並列化またはインデックス構築に対応 (インデックスベースの場合) • インデックスの再作成が速い (インデックスベースの場合) • インデックスの更新が速い (インデックスベースの場合) • 複数のインデックスからの結果を結合する (インデックスベースの場合) • 近接チェック: 近くにある単語に高い関連性を与える