問題タブ [elki]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elki - インデックスの実装
PH ツリー インデックスに長方形の範囲クエリを実装しようとしています。次の質問があります。
- 既存の実装を見ると、格納されているすべてのデータはポイント データのように見えます (左下または右上隅によって定義される長方形/直方体/... とは対照的に)。本当?または、リレーションから、点と四角形を格納しているかどうか、また四角形の左上隅をどこから取得できるかをどのように判断できますか?
- 長方形内にあるすべての点を単純に返す (または、特定のクエリ長方形と交差するすべての長方形を返す) クエリの種類はありますか? を見まし
RangeQueryたが、ドキュメントから、指定された範囲の最近傍を返すようです。同様に、 の他の実装は、DatabaseQueryこの標準クエリをサポートしていないようです。 - 既存のテストを取得して実装を検証する方法はありますか? アノテーションを実装
IndexFactoryするだけで十分ですか?@apiviz - 少し話がずれているかもしれませんが、ELKI メーリング リストが見つかりませんでした。Web サイトでは、更新情報とニュースの「ユーザー メーリング リスト」について言及していますが、LMU 外部からの登録はブロックされています。このサイトにはコミュニティ メーリング リストも記載されていますが、リンクが見つかりませんでした。誰かここに投稿してもらえませんか?
java - 階層的クラスタリングのための ELKI ソースコードの使用
階層クラスタリングに ELKI (インデックス構造でサポートされている KDD アプリケーションを開発するための環境) を使用しようとしています。そこで、数日前に ELKI ソース コード (Maven プロジェクト) をインポートし、miniGUI を実行しました。
私の質問は次のとおりです。
結果に ResultVisulizer を使用したい。しかし、resulthandler に ResultVisulizer アイテムがないことがわかりました。この ResultVisulizer アイテムをここにリストするにはどうすればよいですか?
階層的クラスタリングの樹状図が見たいです。この目的のために、この miniGUI でどのパラメーターを設定する必要がありますか?
machine-learning - ELKI における DBSCAN MinPts パラメータの意味
一見些細な質問があります。ELKI 実装における DBSCAN MinPtsパラメータの意味を明確にしてくれる人が必要です。
k = 4の値を使用してソートされたk -dist グラフをプロットすると、点pから 4 番目に近い点までの距離を意味します。これは、近傍に 5 つのポイント ( k + 1) が含まれていることを意味します。4 つの近傍と点p。
ELKI では、MinPtsは隣接点のみを意味しますか、それとも点pも含みますか? 上記の場合、4または5に設定する必要がありますか?
元のDBSCAN の論文(Ester et al. 1996) では、MinPtsを k ( MinPts = 4) に設定することが述べられています。DBSCAN ウィキペディアの記事も、MinPtsがpの周囲の近傍を参照していることを暗示しているようです。ただし、ELKI は MinPts が k + 1 ( MinPts = 5) に設定されていることを期待しているようです。
誰か親切に説明してください。
vector - ELKI 1D データの外れ値検出
ユークリッド距離に基づいて 1D データで LOF を取得しようとしています。しかし、「少数派のラベルが見つからなかったため、異常値を評価できませんでした」というメッセージが表示され続けます。エラー。下記を参照してください。データは次のようになります。
0.366959
0.134065
0.54
0.292419
0.449071
0.42
0.208460
0.336666
これが私が与えるコマンドです:
クラスタリングは正しく行われますが、外れ値の検出に失敗します。ここで何か不足していますか?
terminal - ELKIs データジェネレーター使用時のエラー
端末の扱いが下手なせいかもしれませんが、ここで例外が発生する理由がわかりません。フォルダを抽出しました。そして、その道は正しいと思います。
cluster-analysis - ELKI でインデックスを作成する方法 - OPTICS クラスタリング
私は ELKI の初心者で、これを使用して .csv ファイルから約 10,000 の緯度経度ポイントをクラスター化しています。設定が正しくなったら、1MM ポイントまでスケールアップしたいと思います。
LngLatDistanceFunction で OPTICSXi アルゴリズムを使用しています
パフォーマンスの大幅な改善を確認するために、「STR 一括読み込みで R* ツリー インデックスを有効にする」について読み続けています。チュートリアルはあまり役に立ちませんでした。
この機能を実装する方法に関するヒントはありますか?
java - ELKI for OPTICS Xi - 高速化できますか?
ELKI は初めてですが、実行したいアルゴリズムの調整に成功しました。3K 座標で使用したところ、非常に高速でした。そのため、現在、約 1 MM レコードにスケールアップしようとしています。現在、私は 30K で実行していますが、数時間経ちましたが、まだ実行されています。
パフォーマンスを向上させる方法はありますか? java.exe *32 が ~13% の CPU と 150KB のメモリしか使用していないことに気付きました (マシンは 2.8 GHz i7 で 32 GB RAM)
2つの次元(経度/緯度)のみで作業するという他の誰かの以前の提案に基づいて、ページサイズ1024を使用しました
Windows コマンドラインから直接実行:
cluster-analysis - ELKI DBSCAN の結果でオブジェクトを識別する方法は?
ELKI GUI を使用して DBSCAN アルゴリズムを実行しています。私の入力は CSV ファイルです。特徴選択として投影を作成します。
ELKI はいくつかのファイルをクラスターとして提供します。これらのファイルには、射影された属性のみが含まれ、 UserIdが存在しないなどの他の属性が含まれます。クラスタ内の各オブジェクトのUserIdを特定するにはどうすればよいですか?