問題タブ [knn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ggplotのKNNモデルの等高線?
関数を使用してプロットしているKNNモデルがありcontour
ます。これは私がやっているようなことの簡単な例です(このPurdue試験に基づいています):
私の質問は、ggplotでこれと同じプロットを作成するにはどうすればよいですか?特に、どうすれば同等のことができcontour
ますか?
machine-learning - K 最近傍アルゴリズム
KNN アルゴリズムを使用して、k=5 とします。ここで、未知のオブジェクトを 5 つの最近傍を取得して分類しようとしています。4 つの最近傍を決定した後、次の 2 つ (またはそれ以上) の最近傍オブジェクトの距離が同じ場合はどうすればよいですか? これらの 2 つ以上のオブジェクトのうち、5 番目に近いオブジェクトとして選択する必要があるのはどれですか?
c# - 画像認識における k 最近傍法
私は現在、私の研究のためのプロジェクトまたはガイド/チュートリアルを研究しています。私は 3 つの葉の異なる種を特定する必要があり、それぞれに 100 個のサンプル (具体的には 300 個) を使用しています。データベースを参考に。
サンプルのアップロードとシステムの画像処理は完了しましたが、それらを分類する際に KNN アルゴリズムを適用する必要があります。提案やステップバイステップのチュートリアルはありますか?
アルゴリズムをコーディングする上で勉強する必要がありますか、またはC# 言語での画像分類で KNNを簡単に適用するための既存のライブラリはありますか? 葉の種ごとに 100 個の画像サンプルがあれば十分ですか?
詳細: martijin_himself の回答からの返信
はい、私は木の葉について話している。問題は、考慮すべき唯一の特徴が木の葉の形だということです。色、サイズなどの他の機能を無視する。そして、これらの「特徴ベクトル」をいつどのように抽出するか、それらをどこに配置するか、画像サンプルを葉を分類するための参照としてどのように使用するかは正確にはわかりません
システムの画像処理部分については、画像は 2 値化とブロビングのプロセスを経て、画像はその形状のみを考慮します。したがって、データベースにアップロードしたすべてのサンプルについても同様です。回答に必要な情報が不足していたら大変申し訳ありません。我慢してください。
前もって感謝します!:)
r - Rでスパースペアワイズ距離行列を計算する
行列があり、ポイント間のユークリッド距離NxM
の行列を計算したいと考えています。私の問題では、約100,000です。この行列を k 最近傍アルゴリズムに使用する予定であるため、最小距離のみを保持する必要があるため、結果の行列は非常にまばらになります。これは、たとえば、密な行列になる (およびおそらく私のサイズのストレージの問題) から得られるものとは対照的です。NxN
M
N
k
NxN
dist()
N
これまでに見つけた kNN のパッケージ ( knnflex
、kknn
など) はすべて、密行列を使用しているようです。また、Matrix
パッケージはペアワイズ距離機能を提供しません。
私の目標に近づくと、spam
パッケージには、nearest.dist()
あるしきい値未満の距離のみを考慮することができる機能があることがわかりますdelta
。ただし、私の場合、特定の値delta
によって生成される距離が多すぎる (行列を密に格納する必要があるNxN
) か、距離が少なすぎる (kNN を使用できない) 場合があります。
パッケージを使用してk-means クラスタリングを実行しようとする以前の議論を見bigmemory/biganalytics
たことがありますが、この場合、これらの方法を活用できないようです。
Rで疎な方法で距離行列を計算する関数/実装を知っている人はいますか? 私の (恐ろしい) バックアップ計画は、2 つのfor
ループを持ち、結果をMatrix
オブジェクトに保存することです。
python - PythonのK最近傍
PythonでK最近傍法を計算したいと思います。どのライブラリを使用する必要がありますか?
statistics - k最近傍分類器ですが、分布を使用していますか?
いくつかの 2D データの分類器を構築しています。
クラスがわかっているいくつかのトレーニング データがあり、これらをグラフにプロットしてクラスタリングを確認しました。
観察者には、明らかな別個のクラスターがありますが、残念ながら、それらは密集したクラスターではなく、線上に広がっています。水平から約 80 度、別の 45 度、および別の約 10 度の角度で上昇する 1 つの線の広がりですが、3 つすべてが原点に戻っているように見えます。
いくつかのテストデータで最近傍分類を実行したいのですが、見た目から、テストデータがトレーニングデータと非常に似ている場合、データが近い場合を除いて、3近傍分類器は正常に機能しますこの場合、3 つのクラスターが非常に接近しており、いくつかのエラーが発生する可能性があります。
クラスターの推定ガウス分布を考え出す必要がありますか? もしそうなら、これを最近傍分類子とどのように組み合わせることができるかわかりませんか?
ご意見をお寄せいただきありがとうございます。
乾杯
ruby - k 最近傍を実装するために必要なデータは何ですか?
現在、reddit-clone タイプの Web サイトを持っています。ユーザーが以前に気に入った投稿に基づいて投稿を推奨しようとしています。
これを行うには、K 最近隣または k 手段が最適な方法のようです。
これを実際に実装する方法を理解できないようです。いくつかの数式を見たことがありますが (k はウィキペディアのページにあるものなど)、あまり意味がありません。
これを行う方法をよりよく理解できるように、誰かが疑似コードまたは参照する場所を推奨できますか?
neural-network - 自己組織化マップ(SOM)は色空間で画像をクラスタリングするのに効果的ではない?
ai-junkie ウェブサイトhttp://www.ai-junkie.com/ann/som/som1.htmlで実験を再現して、より大きな色で自己組織化マップ (SOM) を使用して異なる色をクラスター化/グループ化しようとしています。データセット。私は約 400 の異なる単色の画像を使用しています。それらは単色であるため、任意の色空間 (RGB など) の色の値は、特定の画像のすべての点で同じになります。したがって、SOM を使用してクラスタリングする前に使用する機能は、各画像の 3 次元の色の値にすぎません。
http://knnl.sourceforge.net/から取得したソースコードを40 行、40 列、20 回の反復 (エポック = 20) で SOM を実行すると、クラスタリングの結果が意味をなしません。私は次のように見えます:
これは単なるランダム クラスタリング (と呼べる場合) であり、k-means アルゴリズムでさえもより良い結果が得られるように感じます。何が間違っていた可能性があるかについて何か考えはありますか?
classification - 単純ベイズ分類器-複数の決定
単純ベイズ分類器を使用して複数の決定を生成できるかどうかを知る必要があります。複数の決定を支持する証拠がある例は見つかりませんでした。私はこの分野に不慣れです。だから、私は少し混乱しています。
実は文字認識ソフトを開発する必要があります。そこで、与えられたキャラクターが何であるかを特定する必要があります。ベイジアン分類器は、与えられた文字が特定の文字であるかどうかを識別するために使用できるようですが、他の提案を与えることはできません。
たとえば、「3」の画像が与えられた場合(「3」だと思います)、システムがそれを「3」として識別できない場合です。システムが「2」のように見える場合、システムは「2」を返す必要があります。
単純ベイズ分類器について私が持っている考えは、データをトレーニングすると、特定の文字が特定の文字であるかどうかをシステムに尋ねることができるということです。例えば。特定の番号の画像を描画し、それが「2」であるかどうかをシステムに尋ねます。
さらに、KNN(k最近傍)が複数の決定を行うことに気づきました。それに与えられたキャラクターは、トレーニングデータで与えられた最も近い互換性のあるキャラクターを決定します。
ナイーブベイズ分類器を使用して上記のような複数の決定を行うことができるかどうかを誰かが説明してくれれば幸いです。