0

最近、私はいくつかのクラスタリング アルゴリズムを使用しており、この分野に関連する質問をしたかっただけです。この分野で働いている人は、すでにこの答えを持っているかもしれません。

クラスタリング中に、クラスタ化するトレーニング データが必要です。反復回数 (例: K-Means アルゴリズム) は、トレーニング データの数 (ベクトルの数) に依存します。トレーニング データから最も重要なデータを見つける方法はありますか。つまり、すべてのデータを使用して K-Means をトレーニングする代わりに、重要なベクトル (ほとんどのクラスターに影響を与えるベクトル) だけを見つけて、これらの「重要な」ベクトル (トレーニング データから) を使用してトレーニングする方法があるかもしれません。アルゴリズム。

あなたが私を理解してくれることを願っています。読んで答えてくれてありがとう。

4

1 に答える 1