問題タブ [hdbscan]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cluster-analysis - 「dbscan」パッケージで利用可能な hdbscan 関数の下で、新しいポイントのクラスター メンバーシップを予測できません
「dbscan」というパッケージの hdbscan 関数を使用して、データのクラスタリングを実行しています。クラスターが構築された後、新しいデータ ポイントのメンバーシップを予測できません。予測関数は、dbscan 関数で構築されたオブジェクトに対して機能しますが、hdbscan に対しては機能しません。エラーは次のとおりです。
なにか提案を?
python - HDBSCAN と近似予測の問題
HDBSCAN クラスタリング手法を使用して外れ値を予測したいと考えています。パラメータを最適化するためにモデルをトレーニングしましたが、新しいデータにapproximate_predictを適用すると、元のモデルとは異なるクラスターとラベルが得られます。ここでは処理の流れを説明します。
次のようなデータセットがあります。
このデータセットには、パラメーターを最適化する目的で、人為的に追加された外れ値があることに注意してください。次に、適用します。
3 つのクラスターを取得する (外れ値 -1 クラスターを含む):
ここでは、クラスタリングがどのように見えるかを確認できます。
この後、「new_observation」と呼ばれるデータフレームを作成します。これは、実際には元のデータセットから取得したランダムな観測であり、適用します。
ここで、私のテスト ラベルは次のようになります: array([ -1, 56, 150, -1])
つまり、これらの観測から、2 つの外れ値と、私が持っていないクラスターに割り当てられた 2 つの観測が検出されます。
さらに、次のようなプロットを見てみましょう。
あるべきではないところに異常値があることがわかります。
approximate_predict がクラスタリングをどのように行っているのか本当にわかりませんが、機能していないようです。誰か助けてください???
ありがとうございました!!!!
python - 距離と制約によって地理的なポイントのリストをクラスター化する
私は配達アプリを持っていて、注文 (各注文には緯度と経度の座標があります) を場所の近接性 (直線距離) と最大注文数や最大合計商品 (各注文には商品の量があります) などの制約によってグループ化したいと考えています。 .
近接グループ化には、DBSCAN を使用しました
この機能に制約を追加するにはどうすればよいですか?
DBSCAN または HDBSCAN 以外のものを使用してこれを行う方法はありますか?
python - Python HDBScan クラスは、最初の関数に入る前の 2 回目の反復で常に失敗します
私は、いくつかの異なる SKLearn、HDBScan、およびカスタム外れ値検出クラスを利用して、集合した外れ値情報を調べようとしています。ただし、何らかの理由で、HDBScan を使用するクラスを反復処理できないというエラーが一貫して発生しています。他のすべての Sklearn および Custom クラスは可能です。私が得ている問題は、HDBScan クラスの 2 番目のパスで一貫して発生しているようで、algorithm.fit(tmp) で即座に発生します。スクリプトをデバッグすると、クラスの最初の行に到達する前にエラーがスローされたように見えます。
何か助けはありますか?以下は、最小限の実行可能な再現です。
提供されたエラーは、最も役に立ちません。