0

私はelasticsearchを使用して、プロセスモデル間の類似性比較を行っています。コアの類似性アルゴリズムは、プロセス モデルに特化する必要があります。つまり、私の想像どおり、elasticsearch のスコア アルゴリズムをカスタマイズする必要があります。

ご存知のように、ES のスコアリングは Lucene スコア アルゴリズムに基づいています。Lucene の DefaultSimilarity はほとんどの場合に非常にうまく機能し、BM25、DRF のような ES の他の類似点を使用できますが、そのようなカスタマイズは通常、既存の Lucene クラスを拡張するか、そのメソッドをオーバーライドして一部の重みを変更または無効にします。

私の場合、スコアリングとして使用する必要があり、基本の Lucene スコア アルゴリズムとは異なるように思われる特殊な数学を作成したいと考えています。私を混乱させたのは、私には2つのオプションがあるようです.1つは、ESでカスタムスコアリングスクリプトを構成できることです.もう1つは、独自のLuceneスコアラーを構築する必要があることです.

どのアプローチを取るべきか、誰かアドバイスをもらえますか? または私が持っている誤解がありますか。私は ES と Lucene についてあまり明確ではないので、私の質問を解決するための他の方法があり、私の場合により適しているかもしれません。どうもありがとう!

4

0 に答える 0