DBSCAN クラスタリング アルゴリズムを実装するコードを Python で記述しました。私のデータセットは 14,000 人のユーザーで構成され、各ユーザーは 10 個の機能で表されます。入力として Min_samples と epsilon の値として正確に何を保持するかを決定できません。どのように決定すればよいですか? 類似度の尺度はユークリッド距離です (したがって、決定がさらに難しくなります)。
質問する
2311 次