問題タブ [elki]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
161 参照

java - elkiのスパースベクトルを持つkmeans

密なベクトルデータでこのメソッドを試すと、正しく実行されますが、疎なベクトルデータではスローされjava.lang.ArrayIndexOutOfBoundsExceptionます。スパース ベクトル データを正しく読み取るために使用できるデータソースは何ですか?

0 投票する
1 に答える
538 参照

java - ELKI はクラスタリング データ ポイントを取得します

elki を使用する場合、kmeans (llyod) クラスターにあるデータ ポイントセントロイドを取得するにはどうすればよいですか?

また、これらのポイントを距離関数の 1 つにプラグインして、任意の 2 つのポイント間の距離を取得できますか?

私の質問の主な焦点は、カスタムデータポイントではなくデータポイントを取得することであるため、この質問は異なります。また、現在機能していないウィキを参照しているため、他のスレッドの回答は現在不完全です。さらに、すべてのライブラリに関するドキュメントは野生のガチョウの追跡のようなものであり、ライブラリを知っている/理解している場合は、ライブラリを理解しようとするのではなく、同じ問題を抱えている他の人が参照するための適切なリファレンスを持つことができるように答えてください。

0 投票する
1 に答える
162 参照

memory - ELKIによる大規模データのクラスタリング

私はELKI's AnderbergHierarchicalClusteringオーバーオブザベーションを含むデータセットに使用しており、各オブザベーションに対して、1500003 つの変数を使用しています:およびそれらはすべて です。latlngpricedouble

次の問題があります。

  • 私のデータセットは受け入れられたものよりも大きいです (<= 65535 観測)
  • このアルゴリズムはright shiftAgnes triangle- (size * (size - 1)) >>> 1- これは大きなRAMニーズにも対応しています。

この問題を解決するために、データ セットを の重複するサブセットに分割することにしました20000 obs

20000 obsが必要になるからです~4.8GB RAM

サブセットに適用されるクラスター結果がセット全体をクラスター化した結果にできるだけ近くなるような方法でデータを分割するための最良のアプローチが何であるかはわかりません。

0 投票する
1 に答える
346 参照

statistics - ELKI クラスタリングは何を意味するのでしょうか?

ELKI elki-bundle-0.7.1 にクラスラベルを提供しています

以下のような多くの統計を提供しますが、それらが何であるかについての情報を見つけることができませんか?

f1-measure、precision、recall は知っていますが、どうすれば複数のメジャーがあるのでしょうか? クラスタリングの結果に応じて計算されるべきではないですか?

ありがとうございました

ペアカウント対策?

エントロピーベースの測定?

BCubedベースの対策?

セットマッチングによる対策?

編集距離測定?

ジニ対策?