問題タブ [elki]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - elkiのスパースベクトルを持つkmeans
密なベクトルデータでこのメソッドを試すと、正しく実行されますが、疎なベクトルデータではスローされjava.lang.ArrayIndexOutOfBoundsExceptionます。スパース ベクトル データを正しく読み取るために使用できるデータソースは何ですか?
java - ELKI はクラスタリング データ ポイントを取得します
elki を使用する場合、kmeans (llyod) クラスターにあるデータ ポイントとセントロイドを取得するにはどうすればよいですか?
また、これらのポイントを距離関数の 1 つにプラグインして、任意の 2 つのポイント間の距離を取得できますか?
私の質問の主な焦点は、カスタムデータポイントではなくデータポイントを取得することであるため、この質問は異なります。また、現在機能していないウィキを参照しているため、他のスレッドの回答は現在不完全です。さらに、すべてのライブラリに関するドキュメントは野生のガチョウの追跡のようなものであり、ライブラリを知っている/理解している場合は、ライブラリを理解しようとするのではなく、同じ問題を抱えている他の人が参照するための適切なリファレンスを持つことができるように答えてください。
memory - ELKIによる大規模データのクラスタリング
私はELKI's AnderbergHierarchicalClusteringオーバーオブザベーションを含むデータセットに使用しており、各オブザベーションに対して、1500003 つの変数を使用しています:およびそれらはすべて です。latlngpricedouble
次の問題があります。
- 私のデータセットは受け入れられたものよりも大きいです (<= 65535 観測)
- このアルゴリズムは
right shift、Agnes triangle-(size * (size - 1)) >>> 1- これは大きなRAMニーズにも対応しています。
この問題を解決するために、データ セットを の重複するサブセットに分割することにしました20000 obs。
20000 obsが必要になるからです~4.8GB RAM。
サブセットに適用されるクラスター結果がセット全体をクラスター化した結果にできるだけ近くなるような方法でデータを分割するための最良のアプローチが何であるかはわかりません。
statistics - ELKI クラスタリングは何を意味するのでしょうか?
ELKI elki-bundle-0.7.1 にクラスラベルを提供しています
以下のような多くの統計を提供しますが、それらが何であるかについての情報を見つけることができませんか?
f1-measure、precision、recall は知っていますが、どうすれば複数のメジャーがあるのでしょうか? クラスタリングの結果に応じて計算されるべきではないですか?
ありがとうございました