問題タブ [dbscan]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
252 参照

java - DBSCAN が正しく機能しない

JavaでDBSCANを実装しています。ここ (ウィキペディア) で与えられたアルゴリズムに従いました。と思ったのですが、なぜかクラスターが1つしか形成されません。Javaコードは次のようになります

ノード クラスは単純で、int x int y とブール値のノイズと訪問済みです。データはここで提供されますここにデータ

0 投票する
3 に答える
5082 参照

machine-learning - DBSCANでは、境界点を決定する方法は?

DBSCAN では、コア ポイントは、Eps 内に MinPts を超えるものとして定義されます。

したがって、MinPts = 4 の場合、Eps で合計 5 ポイントのポイントは間違いなくコア ポイントです。Epsで4点(自分も含めて)ある点はどうですか?コアポイントですか、境界ポイントですか?

0 投票する
1 に答える
801 参照

python - sklearn の DBSCAN を球状メトリックで使用するには?

球体に分散された一連のデータがあり、scikit-learn によって分散された関数 DBS​​CAN にどのメトリックを指定する必要があるかを理解しようとしています。ポイントの分布に使用されるメトリックはユークリッドではないため、ユークリッド メトリックにすることはできません。sklearn パケットには、そのような場合に実装されたメトリックがありますか、またはデータを小さなサブセットに分割するのが (長くて退屈な場合) 最も簡単な方法ですか?

PS私はpythonの初心者です

PPS メトリックを「事前計算」する場合、事前計算されたデータをどのような形式で提出する必要がありますか? このような?

0 - イベント 1 - イベント 2 - ...

イベント1 - 0 - 距離(イベント1,イベント2) - ...

イベント 2 - 距離 (イベント 1、イベント 2) - 0

助けてください?

0 投票する
1 に答える
916 参照

python - dbscan インデックスは範囲外です python

これは私のコードです。

data3 は pandas データフレームです。

次のエラーが表示されます。

何が問題ですか?

0 投票する
1 に答える
696 参照

python - クラスタを保存する方法

dbscan skelearn で以下のクラスターを作成しました。

ここに画像の説明を入力

私のデータはnumpy配列です:

2 つの新しいクラスターを変数としてデータに追加したいと考えています。私が使用したコードは次のとおりです。

それらを変数として保存するにはどうすればよいですか? シルエット係数など、これらのクラスターの品質を評価する機能はありますか?

0 投票する
1 に答える
1028 参照

java - Apache DBSCANClusterer が常に 0 クラスターを返す

apache.commons.math3.ml.clustering から DBSCANClusterer を使用しようとしています。関数 cluster はクラスターのリストを返しますが、私にとってリストのサイズは常に 0 です。何が間違っていますか? 以下は私のテストコードです:

ファイル clust.txt には、X 値と Y 値が tabulator で区切られた 2 つの列が含まれています。いくつかの異なるデータを試してみましたが、常に 0 になります。

0 投票する
7 に答える
24712 参照

machine-learning - scikit-learn: DBSCAN による新しいポイントの予測

DBSCAN を使用して、Scikit-Learn (Python 2.7) を使用して一部のデータをクラスター化しています。

ただし、元のデータ X で識別されたクラスターに新しいデータ ポイント Y を割り当てることができる組み込み関数 (「fit_predict」以外) がないことがわかりました。K 平均法には「予測」があります。関数ですが、DBSCANでも同じことができるようにしたいです。このようなもの:

そのため、密度は X から推測できますが、戻り値 (クラスター割り当て/ラベル) は Y に対してのみです。私が知る限り、この機能は R で利用できるため、Python でも何らかの形で利用できると思います。これに関するドキュメントが見つからないようです。

また、新しいデータのラベル付けに DBSCAN が使用されない理由を探してみましたが、正当な理由は見つかりませんでした。

0 投票する
0 に答える
340 参照

java - テキストファイルのJavaでのdbscanクラスタリング

テキスト ファイルにある Java でデータをクラスタ化する予定で、Apache クラスタラーによる DBSCAN クラスタリングを使用したいのですが、残念ながら、それが機能することを理解できません。私は今日それをするべきだったので、私は私を助けてくれることに感謝しています:(

0 投票する
2 に答える
652 参照

java - Apache DBSCANClusterer は常にクラスター内の 1 つのポイントを返します

apache.commons.math3.ml.clustering パッケージの DBSCANClusterer を使用しようとしていますが、成功しません。私はApache Common Math 3.4.1を使用しています

DBSCANClusterer.cluster() メソッドを実行すると、常にポイントのリストの最初のポイントに対応する 1 つのポイントを持つ 1 つのクラスターが取得されます。

私の出力は常に [1009.0, 1019.0] です。ここで何が間違っていますか?

0 投票する
2 に答える
5433 参照

machine-learning - sklearn DBSCAN モデルを使用して新しいエントリを分類する

巨大な「動的」データセットがあり、その上で興味深いクラスターを見つけようとしています。

多くの異なる教師なしクラスタリング アルゴリズムを実行した後、一貫した結果が得られるDBSCANの構成を見つけました。

DBSCANテスト データに従って作成されたモデルを推定して、それを他のデータセットに適用したいと思いますが、アルゴリズムを再実行する必要はありません。データセット全体に対してアルゴリズムを実行するとメモリが不足するため、アルゴリズムを実行できません。また、データが動的であるため、別の時点でモデルが意味をなさない可能性があります。

sklearnを使用して、他のクラスタリング アルゴリズム ( MiniBatchKMeansなど) にはpredictメソッドがあるが、DBSCANないことがわかりました。

MiniBatchKMeans重心はモデルを一意に定義することを理解しています。しかし、そのようなものは存在しないかもしれませんDBSCAN

私の質問DBSCANは次のとおりです。モデルを推定する適切な方法は何ですか? DBSCANテスト データセットで得られた出力を使用して、教師あり学習アルゴリズムをトレーニングする必要がありますか? DBSCANまたは、アルゴリズムを再実行せずに新しいデータを分類するために使用できるモデルに本質的に属するものはありますか?