n個のデータのデータセットがあり、各データは抽出された特徴のセットで表されます。一般に、クラスタリングアルゴリズムでは、すべての入力データが同じ次元(同じ数の特徴)を持つ必要があります。つまり、入力データXは、それぞれがd個の特徴を持つn個のデータポイントの*d行列です。私の場合、以前にデータからいくつかの特徴を抽出しましたが、各データに対して抽出された特徴の数はおそらく異なる可能性があります(つまり、データポイントに同じ数の特徴がないデータセットXがあります)。データが同じ次元である必要があるいくつかの一般的なクラスタリングアルゴリズムを使用してそれらをクラスタリングするために、それらを適応させる方法はありますか?
ありがとう