問題タブ [elki]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - ELKI が処理できるデータセットのサイズはどれくらいですか?
ELKI の OPTICS アルゴリズムを使用してクラスター化したい 100,000 点があります。このポイント セットには、約 50 億エントリの上三角距離行列があります。ELKI がマトリックスを希望する形式では、約 100 GB のメモリが必要になります。ELKI はその種のデータ ロードを処理するのでしょうか? 以前にこの作業を行ったことがあるかどうか、誰でも確認できますか?
database - ELKI でインデックス構造を使用するにはどうすればよいですか?
これらはhttp://elki.dbs.ifi.lmu.de/ からの引用です:
「本質的に、抽象距離クエリをデータベースにバインドし、この距離の最近傍検索を取得します。この時点で、ELKI は自動的に最も適切な kNN クエリ クラスを選択します。距離関数に適切なインデックスが存在する場合 (すべてのインデックスがすべての距離を加速できるわけではありません!)、ここでは自動的に使用されます。"
「getKNNForDBID メソッドは、低速の線形スキャンに要約される可能性がありますが、データベースに適切なインデックスがある場合、インデックス クエリが使用されます。その後、アルゴリズムは O(nk log n) または O(nk) 時間で実行できます。」
問題は、どのような基準で ELKI がインデックス クエリを実行するかどうかを選択するかということです。
「データベースに適切なインデックスがある場合」とはどういう意味ですか?どうすればそれを保証できますか?
「run」メソッドの署名に関する別の無関係な質問ですが、1 つではなく 3 つの署名があるのはなぜですか? それらの違いは何ですか?また、使用する署名を決定する基準は何ですか?
cluster-analysis - ELKI - 使用リストデータベースに入力するオブジェクトの数
素朴な質問で申し訳ありませんが、利用可能なすべてのチュートリアルに従っている間に行き詰まりました。では、ファイルを読み込んでロードするのではなく、単純なリストからデータベース db を設定する方法はありますか?
基本的に私が探しているのは次のようなものです:
リスト オブジェクト = ...
データベース db = ClassGenericsUtil.parameterizeOrAbort(ArrayDatabase.class, params, objects);
デシベル初期化();
前もって感謝します。
data-mining - ELKI ツール - ABOD の外れ値検出結果
ABOD メソッドを使用して外れ値検出のために ELKI を実行しようとしています。結果としてさまざまなビジュアライゼーションが表示されますが、外れ値のスコアやランキングは表示されません。ELKI を使用して上位 10 個の外れ値を取得するにはどうすればよいですか?
algorithm - ELKI MiniGUI を使用して、属性値の空間的な外れ値を検出するための空間 KNN を作成します。
ELKI MiniGUI を使用して空間的外れ値検出アルゴリズムを実行するのに問題があります。多くのアルゴリズムでは、データベース内のオブジェクトごとに KNN のリストが必要です。KNN ラベル リストは、最初に空間座標データベースのみから作成する必要があり、属性は含まれないようです。次に、空間外れ値検出アルゴリズムが、空間 KNN の外部ファイルと共に属性データベースで実行されるとします。
私の Java 経験は限られているので、コマンド ラインで ELKI を使用し、MiniGUI を使用して各タスクのコードを組み立てたいと考えています。ただし、MiniGUI では、1) 三角距離行列と 2) KNN 距離順序の外部ファイルを作成または具体化することしかできませんでした。これには、オブジェクト自体が KNN の 1 つとして含まれているようです。各オブジェクトとその空間近傍のリストの外部ファイルまたはキャッシュ データが本当に必要なようです。KNN Query、KNN Join、事前計算された距離、または事前処理されたデータベース フィルターが役立つかもしれませんが、私にはわかりません。
各オブジェクトの空間的外れ値検出属性関係の KNN 空間関係をその近隣オブジェクトに提供するために必要なファイルまたはキャッシュ データを作成して使用するには、どのような手順が必要ですか? 特に、空間的外れ値検出アルゴリズムと属性データベースで使用する前に、空間近傍関係を最初に作成する必要があるように見えるため、MiniGUI でこれを行う方法がわかりません。
どんなアドバイスでも大歓迎です。
ありがとう!