問題タブ [cluster-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-maps - Google Maps Tiles - 30k 座標をタイルに分割する方法
Google マップで 30k (および増加中) またはそれ以上の座標をタイルに分割することは可能で効果的ですか?
私の目標は、すべての座標にインデックスを付けることです。タイルに割り当て、ズーム レベルごとにタイル サイズを定義します。
クライアント側では、マーカー マネージャーが各タイルのクラスタリングを行います (理想的には 200 ポイント未満)。
新しい座標は、特定のタイルに自動的に割り当てられます。
php - 多数のテキストを比較 (クラスタリング) してマトリックスを使用する
テキストとの関係を計算する次の PHP 関数があります。
変数$terms_in_articleX
は、テキストに現れるすべての単語を含む配列でなければなりません。
20,000 のテキストのデータベースがあると仮定すると、この関数はすべての接続を実行するのに非常に長い時間がかかります。
このプロセスを加速するにはどうすればよいですか? 常に 2 つのテキストのみを比較するのではなく、すべてのテキストを巨大なマトリックスに追加する必要がありますか? コード、できれば PHP でのアプローチがあれば、それは素晴らしいことです。
あなたが私を助けてくれることを願っています。前もって感謝します!
cluster-analysis - プロパティに基づいてオブジェクトを分類する方法を探しています
約 150 個の異なるプロパティを持つ約 10,000 個のオブジェクトのセットがあり、その約 4 分の 1 は多値であるか、他のプロパティに関連しています。
これらのオブジェクトを分類したい約 120 のカテゴリのセットがあり、各カテゴリは「テンプレート」オブジェクトとして定義されています。インスタンスがテンプレートと完全に一致する場合、そのオブジェクトは明らかにそのカテゴリに含まれます...ただし、完全に一致するテンプレートを実際に持っているオブジェクトは約 10% にすぎません。その結果、カテゴリとの類似性に基づいてオブジェクトにスコアを付け、それらを最も一致するものに分類できるようにしたいと考えています。また、非常に類似したオブジェクトのクラスターを特定したいと思います。これは、新しい/洗練されたカテゴリの可能性を示しています。
これは、Weka、RapidMiner、またはその他の機械学習/クラスタリング/分類システムの仕事のようです。しかし、この分野の優れた入門資料を見つけるのに苦労しているため、この場合にこれらのツールを使用するのにどれだけの労力がかかるかわかりません。これは継続的なニーズになる可能性があるため、分析方法や重みなどを簡単に変更できるものを使用したいと考えています.
考え?
algorithm - クラスターの中心を見つける
私は次の問題を抱えています-重要な問題を引き出すために抽象化しました。
私はそれぞれ10ポイントを持っており、それらは互いにある程度の距離を置いています。したい
- クラスターの中心、つまり、他の点とのペアワイズ距離が最小化されているポイントを見つけることができます
。p(j)〜p(k)は、ポイントjとk
p(i)が中心である間のペアワイズ距離を表します。クラスター内のn個のポイントがあるすべての0<j、k <= nに対して、クラスターのポイントiff p(i)st min [sum(p(j)〜p(k))] - クラスター内のデータポイントの数があるしきい値tを超えたら、クラスターを2つのクラスターに分割する方法を決定します。
これはユークリッド空間ではありません。しかし、距離は次のように要約できます-p(i)は点iです:
このクラスターの中心点を計算するにはどうすればよいですか?
terminology - 折りの意味
ウィキペディアを読んでいるときにこのテキストを見ました( http://en.wikipedia.org/wiki/K-means%2B%2B )
著者は、実際のデータセットと合成データセットを使用してこの方法をテストし、通常は速度が 2 倍向上し、特定のデータセットでは誤差が 1000 倍近く向上しました。
1000倍、2倍など、-foldの意味が気になります。これは一種のユニットですか?か何か?どなたか、この用語に関する参考文献を教えていただけますか?
java - Java のスレッドを使用したクラスタリング
Java で時間がかかりすぎる仕事があります。そこで、このジョブをスレッドに分割して実行したいと思います。スレッドがジョブを終了した後、私のサービスに戻り、サービスはスレッドに新しいジョブを与えます。ThreadGroup は、これまたはその他の推奨事項に適していますか?
php - K-means クラスタリング: 何が問題なのですか? (PHP)
サッカー マネージャー ゲームで動的市場価値を計算する方法を探していました。ここでこの質問をしたところ、Alceu Costa から非常に良い回答が得られました。
このアルゴリズム (90 要素、5 クラスター) をコーディングしようとしましたが、正しく動作しません。
- 最初の反復では、高い割合の要素がそのクラスターを変更します。
- 2 回目の繰り返しから、すべての要素のクラスターが変更されます。
- アルゴリズムは通常、収束するまで (どの要素もそのクラスターを変更しない) 動作するため、私の場合は終了しません。
- そこで、手動で 15 回目の繰り返しに終了を設定しました。無限に走っていることがわかります。
ここで私のアルゴリズムの出力を見ることができます。どうしたの?正しく動作しない理由を教えてください。
あなたが私を助けてくれることを願っています。事前にどうもありがとうございました!
コードは次のとおりです。
matlab - Matlab:K-means クラスタリング
19 個のクラスターにクラスター化する A(369x10) の行列があります。私はこの方法を使用します
idx(369x1) と ctrs(19x10) が得られます
ここまでで要点がわかりました。A のすべての行は、19 個のクラスターにクラスター化されています。
これで、配列 B(49x10) ができました。この B の行が、指定された 19 個のクラスターのどこに対応するかを知りたいです。
MATLABでどのように可能ですか?
前もって感謝します
php - マップ クラスタリング アルゴリズム
現在のコードは非常に高速ですが、より多くのマーカーに対応できるように、さらに高速化する必要があります。助言がありますか?
ノート:
- SQL ステートメントがマーカー名で並べ替えられている場合、コードは最も速く実行されます。これは、マーカーをクラスタ化する非常に部分的なジョブを実行します (同じ場所にあるマーカーの名前は、多くの場合、常に似ているわけではありません)。
- マーカーは動的に検索およびフィルタリングできるため、マーカーを事前にクラスター化することはできません。
- グリッドベースのクラスタリングを試しましたが、結果はあまり良くありません。
- クラスターがメルカトル図法でわずかに歪んでいることはわかっています。
- 商用のクラスタリング サービスには興味がありません。
コード:
アップデート
現在のコードは次のとおりです。
image - データクラスタリングは画像またはパターン認識にどのように役立ちますか
ノードを表すランダムなデータポイント間のクラスターを見つけるために、さまざまなデータクラスタリングアルゴリズムをいじっています。データクラスタリングが画像認識に使用されていることを読み続けています。接続に失敗しています。クラスタリング データは、画像の認識や顔認識にどのように役立ちますか。誰かがこれを説明できますか?