machine-learning - ドキュメントクラスタリング後に特定のクラスタでクエリ検索を実装する方法は?

Question

クラスとして2つのクラスターがあり、

Cluster : class

DocumentList : List<Document>
centroidVector : Map<String,Double>

ここでの問題は、クエリが検索されると、ファイルとして解析され、ドキュメントオブジェクトに作成され、documentIndex に追加され、そのインデックスが他のドキュメントと共に構築されることです。トークン化、ステミングなどの同じ手順を実行する必要があったため、これを行いました。そのため、クエリベクトルとクラスターベクトルの間で内積を取る必要があります。しかし、インデックスはメモリ内に作成され、データベースには保存されないため、実装方法がわかりません。まだそれをやっている途中です。

ありがとうございました

score 2 · Accepted Answer

クラスタリングは検索用ではありません(つまり、インデックス作成など)。これは、情報をより速く取得するためではなく、データセット内の不明な構造を見つけることを目的とした分析ステップです。検索を高速化するために構造を利用できる場合もありますが、これを利用できるインデックスが必要です。

類似検索をしたい場合は、すぐに索引を作成してください。次に、前にいくつかのクラスタリングを実行して、インデックスを改善してみてください。

machine-learning - ドキュメント クラスタリング後に特定のクラスタでクエリ検索を実装する方法は?

1 に答える 1

Related

Reference

machine-learning - ドキュメントクラスタリング後に特定のクラスタでクエリ検索を実装する方法は?