1

新しいプロジェクトでデータのインデックス作成にApache solrを使用することを検討しています。データはさまざまな独立したタイプで構成されています。つまり、たとえば次のようなものがあります。

  • 植物薬
  • 動物
  • コンピュータ

インデックスする。タイプごとに異なるインデックスを使用する必要がありますか、それとも 1 つのインデックスのみを使用する方が理にかなっていますか? 多くのインデックスを使用するとパフォーマンスにどのような影響がありますか? または、これを達成する他の可能性はありますか?

ありがとう。

4

1 に答える 1

8

どちらも正当なアプローチですが、トレードオフがあります。まず、データセットの大きさは? 複数のサーバーにまたがってパーティション化するのに十分な大きさの場合は、おそらく異なるインデックスを使用するのが理にかなっています。

2 つ目は、パフォーマンスの重要性です。すべてをまとめてインデックスを作成すると、パフォーマンスが低下する可能性がありますが、その程度は、データの量とクエリの複雑さに依存します。

3 番目に、同じ検索で複数のデータ型を照会する必要がありますか? もしそうなら、すべてを一緒に索引付けすることは、これを可能にする便利な方法です。技術的には、これは個別のインデックスで実現できますが、クエリに最も関連性の高い結果を取得することは困難になる可能性があります (まだ実現していないわけではありません)。

第 4 に、単一のスキーマと構成を持つ単一のインデックスにより、システムの展開と保守を行う担当者の作業が簡素化されます。

もう 1 つ考慮する必要があるのは ID です。さまざまなオブジェクトのすべてが、すべてのタイプにわたって一意の識別子を持っているでしょうか。そうでない場合、それらを一緒に索引付けする場合は、おそらくこれを生成する必要があります。

于 2009-06-16T11:42:56.900 に答える