1

ES にセマンティクスを追加する最良の方法は何ですか? 私はこれを読みました:NLPとelasticsearchを使用したセマンティック検索ですが、ここには多くの手動のものがあり、その上、これはかなり古いものです。例: 教師なしタスクでは、トピックのリストとドキュメントが属するトピックを事前に知ることはできません。また、この問題はドキュメントのクラスタリングとは異なります。クラスタリングを通じて、すべてのドキュメントが類似していると言えます。しかし、クエリがこれらの類似したドキュメントである必要があると言う方法はありますか?

例: 「機械学習」クエリは、重み付きの「機械オペレーター」ドキュメントではなく、「データ サイエンス」、「データ マイニング」、または「パターン認識」ドキュメントを取得する必要があります。ここでは、クラスタリング (LDA の可能性があります) が役立つかもしれませんが、クエリ用のドキュメントを提供するのはドキュメントを正確にクラスタリングすることではなく、おそらくその拡張です (私にはわかりません)。それとも、ドキュメントをクラスタリングし、TF ベースのアルゴリズムを使用するときに検索スペースを削減するだけですか。クラスター上。

この問題に LSA を使用してみました。LSA は (SVD を介して) 縮小されたマトリックスを提供しますが、この結果を ES でどのように使用しますか? これを行ったとしても、どのようにスケールしますか?

より良いアプローチはありますか?

4

0 に答える 0