0

私は紺碧の検索でインデックスを構築しています。インデックスにはいくつかのフィールドが含まれていますが、検索可能としてマークしたフィールドは 2 つだけです。インデックスには、さまざまなサイズの完全な単語の pdf ファイル (もちろんそれらのテキスト) と、ドキュメント検索で使用できる目的があります。

インデックスのサイズは大きく、ドキュメントは 160k、サイズは 7.2 GB です。

2文字までのクエリを実行すると、すべてが機能しますが、複雑な単語をヒットするとパフォーマンスが低下します。

例: フレーズ - elasti には 59 秒かかりました。

私のクエリでは、フィルター、スコアリングプロファイルのハイライトを使用しています

調査の結果、ハイライト機能が問題の原因であることがわかりました。

何か案が?どうすればパフォーマンスを向上させることができますか?インデックスのいくつかのフィールドに分割するか、そのようなものでしょうか?

4

2 に答える 2

1

今週、蛍光ペンのパフォーマンスを向上させる変更を展開しました。この機能を有効にするには、インデックスの再作成が必要です。問題が解決しない場合は、nateko@microsoft.com まで直接ご連絡ください。お時間をいただきありがとうございました。

ネイト

于 2015-05-01T21:49:04.483 に答える
0

あなたの推測は正しいです。検索のハイライトがここで問題を引き起こしています。強調表示が有効になっている場合、Azure Search はクエリ時に結果セット内の各項目/テキストを処理して、検索ヒットを含むテキスト セグメントを見つけます。各テキストが 4.5MB (7.2GB/160K) の場合、処理に時間がかかる場合があります。複雑な用語や語句の場合、時間がかかるのは、十分な数のセグメントが見つかった後で Azure Search が結果の処理を停止するためです。私は Azure Search チームで働いています。コードを見て確認してみます。

于 2015-02-25T18:11:50.047 に答える