1

フィールド要素の数がインデックス/検索パフォーマンスに与える影響は?

最大 400 のフィールド要素を持ついくつかのドキュメントを含む次のドキュメント構造があります。solr サーバーの CPU 使用率が上昇するのを確認しており、問題を要素数の増加に限定していませんが、誰かがそうしたかどうか疑問に思っています。any analysis on the Solr performance vs # of field elements.

自動コミットを有効にして、インデックス作成と読み取りの両方に単一の Solr サーバーを使用しています。

<add>
    <doc>
        <field name="id">User 4990</field>
        <field name="type">User</field>
        <field name="type">ActiveRecord::Base</field>
        <field name="class_name">User</field>
        <field name="id_i">4990</field>
        <field name="login_s">someuser</field>
        <field name="first_name_s">some</field>
        <field name="last_name_s">user</field>
        <field name="email_s">someuser@somecompany.com</field>
        <field name="department_s">department-psg</field>
        <field name="activated_b">true</field>
        <field name="private_profile_b">false</field>
        <field name="deleted_b">false</field>
        <field name="followers_im">4834</field>
        <field name="followers_im">4965</field>
        <field name="followers_im">3</field>
        <field name="followers_im">4291</field>

        ...
        ...
        ..
        <field
            ..
        <**400** such fields

    ..
    </doc>
</add>

Solr バージョン: 3.6.1、Cent OS 5.6 上の Java 6

4

1 に答える 1

1

すべてのフィールドを検索するかどうか、使用している演算子、フィールドに格納されているデータのサイズ、スキーマでのフィールドの定義方法、およびフィールドのみを検索するか、フィールドからデータを取得して表示するかによって異なります。 .

一般的に、検索は非常に高速です。私のスキーマでは、フィールドが 100 まであります。ただし、速度を低下させる可能性のある非効率的なクエリがあります。詳細については、solr パフォーマンス wikiを参照してください。

私自身の経験から、ハイライトはハイライトするフィールドの数に強く影響されると言えます。これは、各結果ドキュメントの各フィールドにハイライトが適用されるためです。つまり、フィールドの数が多いと、実際には二次的な複雑さが生じます。

于 2012-08-16T12:43:22.177 に答える