問題タブ [elki]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
40 参照

elki - インデックスの実装

PH ツリー インデックスに長方形の範囲クエリを実装しようとしています。次の質問があります。

  1. 既存の実装を見ると、格納されているすべてのデータはポイント データのように見えます (左下または右上隅によって定義される長方形/直方体/... とは対照的に)。本当?または、リレーションから、点と四角形を格納しているかどうか、また四角形の左上隅をどこから取得できるかをどのように判断できますか?
  2. 長方形内にあるすべての点を単純に返す (または、特定のクエリ長方形と交差するすべての長方形を返す) クエリの種類はありますか? を見ましRangeQueryたが、ドキュメントから、指定された範囲の最近傍を返すようです。同様に、 の他の実装は、DatabaseQueryこの標準クエリをサポートしていないようです。
  3. 既存のテストを取得して実装を検証する方法はありますか? アノテーションを実装IndexFactoryするだけで十分ですか?@apiviz
  4. 少し話がずれているかもしれませんが、ELKI メーリング リストが見つかりませんでした。Web サイトでは、更新情報とニュースの「ユーザー メーリング リスト」について言及していますが、LMU 外部からの登録はブロックされています。このサイトにはコミュニティ メーリング リストも記載されていますが、リンクが見つかりませんでした。誰かここに投稿してもらえませんか?
0 投票する
1 に答える
327 参照

java - 階層的クラスタリングのための ELKI ソースコードの使用

階層クラスタリングに ELKI (インデックス構造でサポートされている KDD アプリケーションを開発するための環境) を使用しようとしています。そこで、数日前に ELKI ソース コード (Maven プロジェクト) をインポートし、miniGUI を実行しました。

私の質問は次のとおりです。

  1. 結果に ResultVisulizer を使用したい。しかし、resulthandler に ResultVisulizer アイテムがないことがわかりました。この ResultVisulizer アイテムをここにリストするにはどうすればよいですか?

  2. 階層的クラスタリングの樹状図が見たいです。この目的のために、この miniGUI でどのパラメーターを設定する必要がありますか?

0 投票する
1 に答える
761 参照

machine-learning - ELKI における DBSCAN MinPts パラメータの意味

一見些細な質問があります。ELKI 実装における DBSCAN MinPtsパラメータの意味を明確にしてくれる人が必要です。

k = 4の値を使用してソートされたk -dist グラフをプロットすると、点pから 4 番目に近い点までの距離を意味します。これは、近傍に 5 つのポイント ( k + 1) が含まれていることを意味します。4 つの近傍と点p

ELKI では、MinPtsは隣接点のみを意味しますか、それとも点pも含みますか? 上記の場合、4または5に設定する必要がありますか?

元のDBSCAN の論文(Ester et al. 1996) では、MinPtsを k ( MinPts = 4) に設定することが述べられています。DBSCAN ウィキペディアの記事も、MinPtsがpの周囲の近傍を参照していることを暗示しているようです。ただし、ELKI は MinPts が k + 1 ( MinPts = 5) に設定されていることを期待いるようです

誰か親切に説明してください。

0 投票する
1 に答える
506 参照

vector - ELKI 1D データの外れ値検出

ユークリッド距離に基づいて 1D データで LOF を取得しようとしています。しかし、「少数派のラベルが見つからなかったため、異常値を評価できませんでした」というメッセージが表示され続けます。エラー。下記を参照してください。データは次のようになります。 0.366959 0.134065 0.54 0.292419 0.449071 0.42 0.208460 0.336666

これが私が与えるコマンドです:

クラスタリングは正しく行われますが、外れ値の検出に失敗します。ここで何か不足していますか?

0 投票する
1 に答える
127 参照

terminal - ELKIs データジェネレーター使用時のエラー

端末の扱いが下手なせいかもしれませんが、ここで例外が発生する理由がわかりません。フォルダを抽出しました。そして、その道は正しいと思います。

0 投票する
1 に答える
821 参照

cluster-analysis - ELKI でインデックスを作成する方法 - OPTICS クラスタリング

私は ELKI の初心者で、これを使用して .csv ファイルから約 10,000 の緯度経度ポイントをクラスター化しています。設定が正しくなったら、1MM ポイントまでスケールアップしたいと思います。

LngLatDistanceFunction で OPTICSXi アルゴリズムを使用しています

パフォーマンスの大幅な改善を確認するために、「STR 一括読み込みで R* ツリー インデックスを有効にする」について読み続けています。チュートリアルはあまり役に立ちませんでした。

この機能を実装する方法に関するヒントはありますか?

0 投票する
2 に答える
180 参照

java - ELKI for OPTICS Xi - 高速化できますか?

ELKI は初めてですが、実行したいアルゴリズムの調整に成功しました。3K 座標で使用したところ、非常に高速でした。そのため、現在、約 1 MM レコードにスケールアップしようとしています。現在、私は 30K で実行していますが、数時間経ちましたが、まだ実行されています。

パフォーマンスを向上させる方法はありますか? java.exe *32 が ~13% の CPU と 150KB のメモリしか使用していないことに気付きました (マシンは 2.8 GHz i7 で 32 GB RAM)

2つの次元(経度/緯度)のみで作業するという他の誰かの以前の提案に基づいて、ページサイズ1024を使用しました

Windows コマンドラインから直接実行:

0 投票する
1 に答える
175 参照

cluster-analysis - ELKI DBSCAN の結果でオブジェクトを識別する方法は?

ELKI GUI を使用して DBSCAN アルゴリズムを実行しています。私の入力は CSV ファイルです。特徴選択として投影を作成します。

ELKI はいくつかのファイルをクラスターとして提供します。これらのファイルには、射影された属性のみが含まれ、 UserIdが存在しないなどの他の属性が含まれます。クラスタ内の各オブジェクトのUserIdを特定するにはどうすればよいですか?