ドキュメントの新しいデータセットを探しています。そこからマトリックス用語ドキュメントを抽出し、共クラスタリング アルゴリズムを実行します。
単一ラベルのデータセットのみを探しており、無料でアクセスできるデータセットを好みます。
以下のデータセットは既に知っています:
CSTR
WebKB4
Newsgroups
Reuters
K1A, K1B, wap (WebACE Project)
他に知っている人はいますか?
また、過去 2 年間に作成された新しい共クラスタリング アルゴリズムについても知っていますか?
ありがとう