1

私はSphinxとLuceneのヘビーユーザーでした。Sphinxはデータベースを取得し、インデックスを作成します。そして、Sphinxを呼び出してIDを取得します。

しかし、非常に小さな検索エンジンを作成したい場合はどうでしょうか。ほんの数行のデータと数段落の単語?秘訣は、データの行が絶えず変化していることです。だから、私は「インデックス」を持つことができません。

Sphinxのように、関連性でランク付けできるようにしたいと思います。どうやってやるの? もちろん、私は索引付けを行いません...

4

2 に答える 2

1

それぞれに数行のデータと数段落の単語しかない場合は、すべてをメモリに保持し、コンテンツに最も適したテキストアルゴリズムを使用してください。

于 2010-02-04T23:06:06.990 に答える
0

もちろん、私は索引付けを行いません...

すべてを見ずに、どのように関連性を判断しますか?

データがごくわずかであり、インデックスの維持が実用的でないほど変化している場合は、代わりに、データを検索してクエリを実行し、次にデータが変更されたときにインデックスを削除するときにインデックスを生成できます。 。小さなデータセット、頻繁な更新、およびまれなルックアップでは、これはインデックスを維持するよりも効率的である可能性があります。

于 2010-02-04T22:45:53.980 に答える