問題タブ [k-means]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - k-meansの代わりにk-means++を使用する必要がありますか?
k-means ++アルゴリズムは、元のk-meansアルゴリズムの次の2つの点で役立ちます。
- 元のk-meansアルゴリズムは、入力サイズで超多項式の実行時間が最悪の場合ですが、k-means ++はO(log k)であると主張しています。
- 見つかった近似は、最適なクラスタリングと比較して、目的関数に関してそれほど満足のいく結果をもたらさない可能性があります。
しかし、k-means ++の欠点はありますか?これからは、k-meansの代わりに常にそれを使用する必要がありますか?
statistics - K-meanクラスタリング、クラスターの異なる初期位置が最終的なクラスタリング結果に影響を与えるのはなぜですか?
この質問がここで適切かどうかはわかりません。とにかく、ここの人たちは親切なようです。これが私の質問です。
k-meanクラスタリングの場合、クラスターの初期位置を指定する必要があります。クラスターの異なる初期位置が最終的なクラスタリング結果に影響を与えるのはなぜですか?
r - Rは、ヒートマップを使用してクラスタリングするkmeansを描画します
行列をkmeansでクラスター化し、ヒートマップとしてプロットできるようにしたいと思います。それは非常に些細なことのように聞こえます、そして私はこのような多くのプロットを見てきました。私は周りをグーグルしようとしましたが、それを回避する方法を見つけることができません。
この図にパネルAまたはBのようなものをプロットできるようにしたいと思います。250行5列の行列があるとします。列をクラスター化するのではなく、行だけをクラスター化します。
次に、これらの10個のクラスターをヒートマップとしてプロットするにはどうすればよいですか?あなたのコメントと助けは大歓迎です。
ありがとう。
cluster-analysis - k-meansでクラスターの座標を見つける方法
タイプのキー値のベクトルで k-means クラスタリングを使用しようとしています。私の質問は、ベクトル内の各要素の座標をどのように設定するのですか? 具体的には、キーと値のペアは string-float です。後でクラスターの中心を見つけるためにこれが必要です。
java - Javaでwavファイルを読み取る
Javaでwavファイルを読みたいので、K-meansで分類します。
Javaでwavファイルを読み取り、それらを配列などに割り当てて(アイデアを提案できます)、分類するにはどうすればよいですか?
編集: wavファイルの読み取りとK-meansにAPIを使用したいと思います。
cluster-analysis - 疎行列の要素をクラスタリングするための距離メトリック
K-means を使用して、約 1200 のバイナリ変数に基づいて約 12000 の要素をクラスター化しようとしています。従来の距離測定基準 (ユークリッド、マンハッタン、ハミング、レーベンシュタイン) のいずれも満足のいく結果を生み出していません。
以下の指標を考案しました。
Dist(x,y)= P(x=0|y=1) P(y=0|x=1)の最小値
この種の問題に対して同様のアプローチを使用した人はいますか? この指標の使用に明らかな欠陥はありますか? 私はデータマイニングに比較的慣れていないため、フィードバックをいただければ幸いです。
ありがとう
algorithm - K-meansを使用して、画像のピクセル値ベースの分離を支援できますか?
ピクセル値に基づいてグレーレベル画像を分離しようとしています。1つのビンで0〜60、別のビンで60〜120、120〜180などのピクセルを255まで想定します。この場合、範囲はほぼ等間隔になります。場合。ただし、K-meansクラスタリングを使用することで、ピクセル値の範囲をより現実的に測定することができますか?ピクセルの集中度が低い場所でビンを無駄にせずに、同様のピクセルを一緒に取得しようとしています。
編集(得られた結果を含めるため):
k-クラスターがない場合の平均法=5
algorithm - クラスターサイズが等しいK-meansアルゴリズムのバリエーション
マップ上のポイントを距離ごとに同じサイズのグループにグループ化するための最速のアルゴリズムを探しています。k-meansクラスタリングアルゴリズムは単純で有望に見えますが、同じサイズのグループを生成しません。
このアルゴリズムのバリエーションはありますか、それともすべてのクラスターのメンバーの数を等しくすることができる別のアルゴリズムがありますか?
c++ - 階層的k-「k」の知識がないOpenCVの平均
事前にクラスターの数を知らずに、4Dベクトルのセットをクラスター化しようとしています。過去には、クラスターの数に関する知識があれば、cvKmeans2を使用してクラスター化することができました。私はAPIをトロールしていて、に出くわしcv::flann::hierarchicalClustering
ました。これは必要なことを実行するように見えます(つまり、k-meansを実行し、必要に応じてクラスターを分割し、分割によって結果が悪化するまで繰り返します)が、「インデックスパラメーター」に本当に苦労しています。
2番目のパラメーターとして入力するインデックス構造を作成する必要があることがわかりましたが、次のコードからエラーが発生します。
cv::flann::Index fln_idx = cv::flann::KMeansIndexParams::createIndex( framePoints );
エラーは次のとおりです。
../src/segmentation_1.cpp:592: error: cannot call member function ‘virtual flann::Index* cv::flann::KMeansIndexParams::createIndex(const cv::Mat&) const’ without object
framePoints
以下のように定義されます:
CvMat *framePoints = cvCreateMat( frameTracklets.size( ), 4, CV_32FC1 );
私はかなり愚かなことをしているとかなり確信しています(私のC ++の知識は大丈夫ですが、素晴らしいものではありません)。関連するすべてのコードを投稿したと思いますが、そうでない場合はお知らせください。さらに投稿します。
前もって感謝します!
アップデート
私はLumpNのアドバイスに従い、以下を使用してKmeansオブジェクトを作成しました。
hierarchicalClustering()
これを実行すると、「必要なクラスターの数は次のようになります」などのエラーメッセージが表示されます>= 1
(作業を開始するときに確認する必要があります。実際のエラーで更新します)。createIndex()
私はそれを出発点と仮定しhierarchicalClustering()
、良い結果が見つかるまでクラスターを分割しました(これが最適かどうかはわかりません)。cv::flann::KMeansIndexParams()
いくつかの引数で呼び出す必要がありますか?私はAPIを見て、完全に混乱しています!再度、感謝します!