cluster-analysis - 潜在意味分析のための適切なクラスタリング方法を選択する

Question

テキストドキュメントをクラスター化して、同じコンセプトのドキュメントを見つけたいと考えています。潜在的意味分析 (LSA) を使用して意味的類似性を調べましたが、目的に応じてどのクラスタリング方法を選択すればよいか混乱しています。ありがとうございました

score 1 · Accepted Answer

階層クラスタリングを使用できます。R には RClusterpp というパッケージがあり、大規模なデータの階層的クラスタリングに非常に効率的です (並列計算を行います)。次に、可能な範囲内で異なる数のクラスターのデンドログラムツリーを切り取り、クロス集計を使用してクラスタープロファイルを確認できます。

cluster-analysis - 潜在意味分析のための適切なクラスタリング方法を選択する

1 に答える 1

Related

Reference