-1

クラスとして2つのクラスターがあり、

Cluster : class

DocumentList : List<Document>
centroidVector : Map<String,Double>

ここでの問題は、クエリが検索されると、ファイルとして解析され、ドキュメント オブジェクトに作成され、documentIndex に追加され、そのインデックスが他のドキュメントと共に構築されることです。トークン化、ステミングなどの同じ手順を実行する必要があったため、これを行いました。そのため、クエリ ベクトルとクラスター ベクトルの間で内積を取る必要があります。しかし、インデックスはメモリ内に作成され、データベースには保存されないため、実装方法がわかりません。まだそれをやっている途中です。

ありがとうございました

4

1 に答える 1

2

クラスタリングは検索用ではありません(つまり、インデックス作成など)。これは、情報をより速く取得するためではなく、データ セット内の不明な構造を見つけることを目的とした分析ステップです。検索を高速化するために構造を利用できる場合もありますが、これを利用できるインデックスが必要です。

類似検索をしたい場合は、すぐに索引を作成してください。次に、前にいくつかのクラスタリングを実行して、インデックスを改善してみてください。

于 2012-07-19T18:56:02.270 に答える