私はmatlabのユーザータグの巨大なスパースマトリックスで一連のタグをクラスター化しようとしています:
35000*74000 で 99% のスパース性。
おそらく、次の 2 つの選択肢があります。
1: タグの共起行列を作成し、Tag-Tag 共起行列にクラスタリングを適用します。
2: ユーザーをタグの特徴と見なし、タグのクラスタリングには Transpose(user-tag) を使用します。
どちらが優れているかはわかりませんが、どちらもユーザーとタグのサイズが大きいという問題があります。
コメントや提案された解決策を本当に感謝します。