問題タブ [knn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python-'int'オブジェクトは添え字化できません
私は少しknn分類を試みています。配列内のデータを正規化しようとすると、上記のエラーが発生し続けます。
最後の行に「int」オブジェクトはサブスクリプト可能ではないというエラーが表示されます。
ありがとう
c++ - opencv flann::Index の使い方は?
opencv flann::Index に問題があります -
インデックスを作成しています
その後、ロードして最寄りの近所を見つけようとしています
そして、miniflann.cpp にアクセス違反を行ないます。
助けてください
r - データセットに適用した後の knn.cv (R) の結果の解釈
knn.cv
FNN パッケージのR のデータセットで k 最近傍アルゴリズム (相互検証あり) を使用しているときに問題が発生しました。データ セットは、58 の属性を持つ 4601 の電子メール ケースで構成されます。57 の属性は の文字または単語の頻度に依存しemails(numerical, range [0,100])
、最後の属性はスパム (値 1) かハム (値 0) かを示します。
train 変数と cl 変数を指定し、10 個のネイバーを使用した後、パッケージを実行すると7.4032
、各列のような値を持つすべてのメールのリストが表示されますが、これは使用方法がわかりません。パッケージが分類するスパムとハムのパーセンテージを見つけて、正しいパーセンテージと比較する必要があります。これらの結果をどのように解釈すればよいですか?
algorithm - kNNでの不完全なデータ(データの希薄性)の処理
knnを使用して簡単なレコメンダーシステムを作成しようとしています。
私がいくつかのテーブルを持っているとしましょう:
したがって、ユーザー1の可能なスコアを見つけるには、ユーザー1が他のユーザーと読んだ本の絶対差をとることを考えていました。次に、その違いを使用して、そのリストのどのユーザーがユーザー1に「最も近い」かを調べます。しかし、実際の状況では、より多くの?/不明なスコアがあります。では、 knnを使用するときに、これらの未知のスコアをどのように処理するのでしょうか。
これを実装する方法をまだ本当に理解していないので、私はコードを持っていません。
どんな助けでも大歓迎です!
matlab - KnnImpute Matlab
matlab には、Knn アルゴリズムを使用して行列内の欠損値を置き換えることを許可する KnnImpute と呼ばれる関数があります。http://www.mathworks.it/help/toolbox/bioinfo/ref/knnimpute.htmlを見ると、マトリックスの列を検索することがわかりましたが、行に沿ってチェックしている隣人を検索したいと思います。それを許可する機能はありますか?必要なものを実現するための matlab コードはどこにありますか?
machine-learning - kNN: トレーニング、テスト、および検証
それぞれ1000枚の画像を持つ10のクラスから画像の特徴を抽出しています。抽出できる特徴は 50 個あるので、ここで使用する最適な特徴の組み合わせを見つけようと考えています。トレーニング、検証、およびテスト セットは次のように分類されます。
検証セットでフォワード機能選択を使用して最適な機能の組み合わせを見つけ、最後にテスト セットを使用して全体的な精度を確認します。誰かが私がそれを正しく行っているかどうか教えてもらえますか?
matlab - MATLAB の KNN アルゴリズム
私は親指認識システムに取り組んでいます。画像を分類するには、KNN アルゴリズムを実装する必要があります。thisによると、測定値は 2 つしかありません。これにより、最近傍を見つけるための距離が計算されますが、私の場合、25 X 42 の 400 枚の画像があり、そのうち 200 枚はトレーニング用で、200 枚はテスト用です。数時間検索していますが、ポイント間の距離を見つける方法が見つかりません。
編集: 最初の 200 枚の画像を 1 X 1050 に再形成し、それらtrainingData
を 200 X 1050 のマトリックスに格納しました。同様に、testingData
.
r - R の R ツリーとグラフ パーティショニング ライブラリ
効率的な d 次元の点検索を行う必要があり、d 次元の点の効率的な k-NN クエリも作成する必要があります。したがって、R-Tree ライブラリが必要です。R-Tree 構造を構築するライブラリが必要です。これを使用して、必要なときにいつでもクエリを実行できます。
また、私のアプリケーションにはハイパーグラフは含まれていませんが、METISやhMETISのようなライブラリが必要です。私の要件は、グラフをほぼ 2 つの等しいサイズのグラフに分割するグラフの最小カット セットを見つけることです。
問題は、Rでこれらをサポートするライブラリが必要になることです.
kd-tree ベースの k-NN クエリを持つライブラリRANNを見つけましたが、問題は、すべての k-NN クエリを一度に作成して結果を巨大な配列に格納するか、またはを呼び出す必要があることです。関数 (nn
またはnn2
) が必要になるたびに、O(n lg n) 時間の検索の成長を打ち負かします。
Rにそのようなライブラリがあるかどうか誰か教えてもらえますか?
注:クラスタリング アルゴリズムを効率的に実装するには R-Tree ライブラリが必要であり、CHAMELEON クラスタリング アルゴリズムを実装するにはグラフ パーティション ライブラリが必要です。
java - Java での K 最近傍の実装
私の論文では、さまざまなデータ構造を使用して変更する必要があるため、Java での KNN アルゴリズムの適切な実装を探しています。
前もって感謝します!
java - 分散テキスト クラスタリング フレームワーク
ドキュメントの完全なセットを処理するアルゴリズムをサポートする分散型テキスト クラスタリング フレームワークが必要です。キャロット 2 http://project.carrot2.org/のようなアプリケーションは一連のドキュメントで動作し、メモリ内で計算を行うため、時間がかかり、パフォーマンスが非常に効率的です。lingo、STC、knn などのこの種のテキスト クラスタリング アルゴリズムが分散環境で実行できる場合、それらははるかに高速になります。hazelcast http://www.hazelcast.com/のようなオープンソース ツールを使用するフレームワークはありますか、またはより高速でパフォーマンス効率の高い特定のアプローチはありますか。