問題タブ [k-means]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3202 参照

matlab - MATLAB:図心を描く

私の主な質問は特徴の重心が与えられていますが、MATLABでそれを描画するにはどうすればよいですか?

より詳細には、ブロックを取得し、各ブロックの次元特徴ベクトルを計算するNxNx3画像(RGB画像)があります。これらの特徴ベクトルを行列に格納し、その上で関数を実行して、行列の重心を取得します。ここで、はクラスターの数であり、は各ブロックの特徴の数です。4x46Mx6kmeanskx6k6

アルゴリズムが希望どおりに実行されているかどうかを視覚化するために、これらの中央のクラスターを画像に描画するにはどうすればよいですか?または、画像の重心を視覚化する方法について他の方法や提案がある場合は、大いに感謝します。

0 投票する
2 に答える
4471 参照

algorithm - このクラスタリングの合計エラーの測定値を計算する方法

これは、k-meansクラスタリングアルゴリズムに関する質問です。以下の点とデータのクラスタリングS1があります。このクラスタリングに関連する合計エラーを計算する方法を誰かに教えてもらえますか?厳密にプログラミングの質問ではないことは知っていますが、アルゴリズムには必要です。答えは4/3だと思いますが、どうやって計算すればいいのかわかりません。誰か助けてもらえますか?

0 投票する
1 に答える
1759 参照

c# - データ クラスタリング アプローチ

画像に表示される 200 点のセットを持つプログラムを C# で作成しています。ただし、ポイントはさまざまな地域でクラスター化する傾向があり、「クラスター化」する方法を探しています。つまり、クラスター化されたポイントの周りに円/楕円を描くことができます。

誰もこれを行う方法を見たことがありますか? K-means クラスタリングについて聞いたことがありますが、C# で実装する方法がわかりません。

お気に入りの実装はありますか?

0 投票する
1 に答える
1068 参照

r - Rのbigmemoryパッケージからのbigkmeansによるクラスタリング?

最近、R の biganalytics パッケージの実験を始めました。しかし、問題が発生しました...

bigkmeansたとえば、約2000のクラスター番号で実行しようとしていますclust <- bigkmeans(mymatrix, centers=2000)

ただし、次のエラーが表示されます。
Error in 1:(10 + 2^k) : result would be too long a vector

誰かが私がここで間違っていることを教えてくれますか?

0 投票する
3 に答える
3389 参照

matrix - 非常に大きな疎行列でのクラスタリング?

非常に大きな行列で (k-means) クラスタリングを実行しようとしています。

マトリックスは約 500000 行 x 4000 列ですが、非常にまばらです (行ごとに "1" の値が 2 つだけ)。約2000個のクラスターを取得したい。

2 つの質問があります。- アルゴリズムが終了するのに必要な時間をどのように見積もればよいですか? 一度 weka を試してみましたが、どれくらいの時間がかかるかわからなかったので、数日後に作業を中止しました。

ありがとう!

0 投票する
1 に答える
1783 参照

image - 画像の類似性と k-mean クラスタリング

画像の類似性で少し遊んでいます。実際、私は画像検索システムで遊んでいます。理想的には、同様の画像を取得するためにクエリできる画像インデックスを作成したいと考えています。

私の現在の考えは、ある種の ImageDescriptor をインデックスに格納することであり、各記述子には、k-mean-cluster-centroids、ヒストグラムなど、さまざまな機能を含めることができます。その関数の結果はそのワイトで乗算され、すべての機能で合計されます。最終的な合計は、私のイメージからの距離です。この考えが正しいかどうかわかりませんか?

だから私はヒストグラムで遊び始めました。ヒストグラムとインデックスに保存されたヒストグラムの間の距離を照会するよりも、ヒストグラムのインデックスを保存しました。それはある種の類似性をもたらしますが、ほとんどの場合、良い理想とはかけ離れています。

今、k-mean クラスタリングで遊んでいます。RGB 距離に基づくセグメンテーションを既に実装しています (Lab カラー モードでも試します)。私のインデックスは、(クラスタリングからの)重心のベクトルで構成されています。現在、重心間の最小距離の比較のみを行っています。それはより良い結果をもたらしますが、良いとは言えません。

私の最初の質問は、距離を照会するよりもセグメント (クラスター) を使用して何か良いことはありますか? 形状情報を含めるにはどうすればよいですか?

余談ですが、ほとんどの画像は日用品 (さまざまな鉛筆、さまざまな眼鏡、さまざまな靴など) の画像であり、同じ色の背景にさまざまなテクスチャが使用されています。自然の画像、顔、木、雲、山などはありません...

よろしくザハリエ

0 投票する
1 に答える
756 参照

c# - データベースに保存された情報に複雑なアルゴリズムを実装する

リレーショナルDBに格納されている情報に複雑なアルゴリズムを実装するためのベストプラクティスを見つけようとしています。

具体的には、多くのドキュメントのTFxIDFベクトルを含む大規模なMS SQL Serverデータベースにk-meansアルゴリズム(ドキュメントクラスタリングアルゴリズム)のバリエーションを実装したいと考えています(これらのベクトルはアルゴリズムの入力として使用されます)。

私の最初の考えは、ストアドプロシージャ、関数、ビュー、およびその他すべての基本的なSQL Serverツールを使用してSQLですべてを実行することでしたが、その後、 SQLサーバー。

ここではパフォーマンスが問題になるので、それも考慮する必要があります。

私がとるべき道についてのアドバイスをいただければ幸いです。

ありがとうございました!

0 投票する
5 に答える
33007 参照

matlab - 時系列データに対して K-means クラスタリングを実行するにはどうすればよいですか?

時系列データの K-means クラスタリングを行うにはどうすればよいですか? 入力データがポイントのセットである場合にこれがどのように機能するかは理解していますが、M がデータ長である 1XM で時系列をクラスター化する方法がわかりません。特に、時系列データのクラスターの平均を更新する方法がわかりません。

ラベル付けされた一連の時系列があり、K-means アルゴリズムを使用して、同様のラベルが返されるかどうかを確認したいと考えています。上記のように、私の X 行列は NXM になります。ここで、N は時系列の数、M はデータ長です。

誰もこれを行う方法を知っていますか? たとえば、時系列データで機能するように、この k-means MATLAB コードを変更するにはどうすればよいでしょうか? また、ユークリッド距離以外にもさまざまな距離メトリックを使用できるようにしたいと考えています。

私の疑問をよりよく説明するために、時系列データ用に変更したコードを次に示します。


0 投票する
5 に答える
7754 参照

matlab - MATLABkMeansは常にグローバル最小値に収束するとは限りません

私はMATLABでk-Meansクラスタリングアルゴリズムを作成し、に組み込まれているMATLABに対して試してみようと思いましたkmeans(X,k)

ただし、非常に簡単な4つのクラスターのセットアップ(図を参照)の場合、MATLAB kMeansは常に最適なソリューション(左)に収束するわけではなく、(右)に収束します。

私が書いたものも必ずしもそうとは限りませんが、組み込み関数がこのような簡単な問題を解決し、常に最適な解決策を見つけることができるべきではありませんか?

代替テキスト

0 投票する
1 に答える
17804 参照

cluster-analysis - オンライン k-means クラスタリング

k-Means クラスタリングアルゴリズムのオンライン バージョンはありますか?

オンラインとは、すべてのデータ ポイントがシステムに入力されるたびに 1 つずつシリアルに処理されることを意味し、リアルタイムで使用すると計算時間を節約できます。

私は自分自身で良い結果を書いたことがありますが、修士論文で使用されるため、参照するために「標準化された」ものを持っていることを本当に望んでいます.

また、他のオンライン クラスタリング アルゴリズムに関するアドバイスはありますか? (lmgtfy に失敗しました;))