Lucene でドキュメントのインデックス作成をデバッグしようとしています。ドキュメントがどのようにインデックス付けされたかを正確に確認できるように、インデックスの内容を確認する必要があります。ルークはこれを行っているとされていますが、それに関するドキュメントはまったくありません。また、インデックスディレクトリを指すと(どのディレクトリでも、どれが正しいかを判断できない理由はわかりませんが)。 、何も得られません。確かにこれを行う簡単な方法はありますか?
4 に答える
Luke についてはよく知りませんが、Lucene とはよく一緒に仕事をしてきました。格納されたフィールドのデータしか表示できないため、Luke を使用しても、インデックスが作成されているものを確認するのは難しい場合があります。
私が最後に行った Lucene プロジェクト (実際には Solr) では、事実上すべてのフィールドがインデックス付きとしてマークされていましたが、保存されていませんでした。このような場合、ドキュメントに適切なインデックス用語が含まれているかどうかをテストするには、指定された主キーと予想される用語を使用してドキュメントのインデックスをクエリします。一致する場合、その用語で索引付けされていることがわかります。
たとえば、商品 5 が英語かどうかを確認するには、productId:5 と lang:en とします。
これがルークの使い方に関するあなたの質問に直接答えているわけではないことは承知していますが、ルークがあなたを助けることができない場合は、これが代替手段になるかもしれません.
Luke は、[ドキュメント] タブの [再構築 & 編集] ボタンを使用すると、インデックスが作成されているが保存されていないフィールドの値を表示しようとします。私の記憶が正しければ、「再構築と編集」画面にストップ ワードは表示されません。「null_1」、「null_2」などのように表示されます。