問題タブ [elki]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - ELKI OPTICSXi のクラスター境界の取得
ヒストグラム プロットが複数の極大値を示す 1 次元データ セットがあるため、1 次元空間にはデータがより密集している領域が複数あることがわかっています。特定のデータポイントが含まれる密集領域/クラスターを分類できるように、これらの密集領域の境界を決定したいと考えています。これには、比較するクラスター間の異なる密度をより適切に処理できるはずである OPTICS を使用しています。 DBSCANに。
JavaコードでELKI(バージョン0.6.0)を使用しています(ELKIチームがELKIをJavaに埋め込むことを推奨していないことは知っていますが、多くのデータセットに対してワークフローを繰り返す必要があるため、私の場合はこれを自動化することをお勧めします) . 以下のコード スニペットは、クラスターの開始項目と終了項目のインデックスを出力します。OPTICSModelに関するELKI ドキュメントでは、これらのインデックス番号が何に対応するかを明確に定義していませんが、これらはデータベースの拡張クラスター順序付けにおける開始データ項目と終了データ項目のインデックスであると想定しています (OPTICS.run() の ClusterOrderResult オブジェクトなど)。データベース自体の開始データ項目と終了データ項目のインデックス (順不同) とは対照的です。
ここで、1 次元空間のどこでクラスターが開始および終了するかを知りたいと考えています。したがって、上記のコードが既に取得している開始インデックスと終了インデックスに対応するデータ項目を取得したいと思います。取得したインデックスを取得できる ClusterOrderResult オブジェクトが必要になると思います。ただし、ドキュメントでは、optics.run() を呼び出して取得したクラスタリング結果オブジェクトからそのようなものを取得することはできないようです。この順序付けられたデータベースを取得する方法がないように思われたため、上記のコードの println を以下の println に置き換えることにより、代わりに元の入力データセットからインデックスを取得しようと単純に試みました。
ただし、既に予想していたように、インデックスは元の入力ファイルに属していないようです。これは、1 次元空間で終了境界よりも低い値で終了境界を定期的に出力するためです。OPTICS クラスタリングで見つかった開始インデックスと終了インデックスに対応する元の 1 次元データ値を取得する方法を知っている人はいますか? これらの値を後でコードで使用したいと考えています。
cluster-analysis - ELKI で k-medoids アルゴリズムを実行する
ELKI を実行して、arff ファイルの形式でデータセットに k-medoids (k=3 の場合) を実装しようとしています (ELKI の ARFFParser を使用):

データセットは 7 次元ですが、私が取得したクラスタリングの結果は、1 つの次元のレベルでのみクラスタリングを示しており、これは 3 つの属性に対してのみ行われ、残りは無視されます。このような:

すべてのディメンションのクラスタリングの視覚化を取得するにはどうすればよいですか?
cluster-analysis - ELKI を使用していて、14 を超える次元で問題が発生している
ELKI で SUBCLU を使用しようとしていますが、それを理解するために DBSCAN と KMEANSLloyd を試してみました。残念ながら、最大 14 次元までしか入力できず、それ以上になると、プログラムは「bubble.scaling」のパラメーターを入力していないことをはっきりと認識しているにもかかわらず、不平を言い始めます。「mouse.csv」チュートリアル ファイルと同様の方法でフォーマットされた .csv ファイルを使用してデータを入力しています (これが、最初に 1 より大きい次元のデータを入力する方法を見つけた方法です)。私は何を間違っていますか?
cluster-analysis - ELKI - elki のクラスター オブジェクト オーダー ファイルからクラスターを取得する方法は?
ELKI で OPTICS および DeLiClu アルゴリズムを実行すると、結果としてクラスター オブジェクト オーダー ファイルのみが取得されます。クラスターのリストと、ポイントとそれぞれのクラスター間のマッピングを取得するにはどうすればよいですか?