問題タブ [knn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 機械学習のためにさまざまな NLP 機能を組み合わせる方法は?
さまざまな NLP 機能を使用して KNN 学習をしようとしています。たとえば、bag-of-words とローカル POS タグを使用したいと考えています。
それとは別に、単一の機能で類似度を計算する方法についていくつかのアイデアがあります。カウントでコサイン類似度を使用したり (bag-of-words ベクトルの場合)、POS タグにハミング距離を使用したりします。
ただし、2つを組み合わせる方法がわかりません。この地域の人々は通常、どのようにこれを行っていますか? 誰でもそれを手伝ってもらえますか?
前もって感謝します。
matlab - Matlab で KNN を使用する方法
からのトレーニング データで最も近いデータを見つけるには、matlab で KNN を使用する必要がありますA
。
この種の情報 (トレーニング データ) を持つ .mat のデータがあります。
等々。
次に、アプリケーションを通じて収集する 2 つ目の情報がありますが、取得できるのは
だから今私の質問は、私がする必要があるのはこのようなものだけですか、そして私はこのようなものを使うことができますか?
KNN は何かを学習する必要がありますか、それともテスト データといくつかの現在のデータ ( などA
) をロードし、それを学習する別の関数で数式またはプリロードを実行し、次に 2 番目の関数を使用して結果を得る必要があるだけですか。
よろしくお願いします。
r - 統計学習の要素の図 2.5
図 2.5 のベイズ決定境界を計算する際に、いくつかの困難に遭遇しました。パッケージ ElemStatLearn では、各ポイントでの確率が既に計算されており、輪郭を使用して境界を描画しています。確率の計算方法を教えてください。どうもありがとうございました。
従来のベイズ決定問題では、混合分布は通常正規分布ですが、この例では 2 つのステップを使用してサンプルを生成するため、分布を計算するのに多少の困難があります。
どうもありがとうございました。
r - カテゴリ値を持つRでk-NNを使用する
主にカテゴリの特徴を持つデータの分類を実行しようとしています。その目的のために、ユークリッド距離(または距離を想定した他の数値)は適合しません。
ハミング距離など、さまざまな距離法を選択できる[R]のkNN実装を探しています。{class}のような一般的なkNN実装を、さまざまな距離計量関数で使用する方法はありますか?
R2.15を使用しています
python - k 最近点の検索
次のような多数の機能があります。
IDごとにユークリッド距離を計算し、それらを並べ替えて、最も近い5つの点を見つけたいと思います。私のデータセットは非常に大きいためです。それを行う最善の方法は何ですか。
c# - エッジコストが非対称である場合の最も近い隣人、いくつかの疑問
投稿を明確にするために、コメントに基づいて編集しました。
エッジコストが非対称の場合に、最近傍探索を効率的に実装する方法を考えていました。100から12000のような都市の範囲を考えています。
より詳細には、例として、都市Aから都市Bへの移動(徒歩など)にはコストCOST 1がかかり、 BからAへの移動(電車など)にはコストCOST1 /10がかかります。言い換えれば、ここで私が見ている問題は、移動する都市間のコストを表す非対称行列Cがあり、1つのポイントAを選択した場合、たとえば、最も近い3つの隣接する都市B 1、B 2、B3を効率的に検出する方法です。旅費の面で?クエリを繰り返し実行したい。前処理時間は、膨大ではないにしても大丈夫です。
効率を熟考することで、都市間のコストが対称であるO(lg(n))時間でk最近傍を見つけるのを容易にするkdツリーのようなものを考えることができました。私の場合、これは基本的なkdツリーだけの問題です。これは、2つの都市間での移動コストが両方向で一般的に同じではないためです。問題の要点は、非対称の場合にk最近傍法のようなことをどのように行うことができるかということのようです。
前述の対称性の仮定を修正するために、1本の木ではなく、2本の木を構築してコストを両方向に計算することを考え、両方の木を検索しました。それから私は疑問に思いました、非対称のコストのために特別に何かがすでにあるかどうか、そして/またはアイデアとして2本の木を使用することは完全に間違っているかどうか誰かが知っていますか?
また、2次元のkd木が、必ずしも最適なソリューションであるとは限りません。したがって、他のデータ構造やアルゴリズムへのポインタも歓迎します。特に誰かが私の問題の大きさに関して実際的な経験を持っているなら。ウィキペディアにはかなりの数のアプローチがリストされており、おそらくおおよその解決策でさえ、私がやろうとしていることに適しています(これは学習目的の小さなゲーム用です)。
c++ - opencv最近傍法
私はopencvでCVKnearestクラスを使用して、10の機能を備えた6つのクラスを次のように分類しています。
それから私は使用します:
しかし、結果は常に1です。たとえ、距離がゼロでクラスとして選択されるはずのトレーニングサンプルの機能を提供したとしてもです。
マットの結果を次のように印刷すると、次のようになります。
それは私に浮動小数点を与えます、
だから私の質問は私が間違っていることですか?または、どのようにして適切なクラスラベルを取得する必要がありますか?!
c++ - K 最近傍 C/C++ 実装
k 最近傍アルゴリズムのシリアル C/C++ 実装はどこにありますか?
これを持っているライブラリを知っていますか?
openCV を見つけましたが、実装は既に並列化されています。
シリアル実装から始めて、pthreads openMP と MPI で並列化したいと考えています。
ありがとう、
アレックス
machine-learning - KNNアルゴリズムによる教師あり用語の重み付け方法の使用
KNN分類器で教師あり用語重み付けモデルを使用することは可能ですか?テストドキュメントにラベルがなく、監視対象の用語重み付けモデルで重みを計算するためにラベル付きドキュメントが必要である限り、テストドキュメントのベクトルをどのように表すのか疑問に思います。誰か助けてもらえますか?
matlab - カテゴリ データによる KNN 分類
k 最近傍回帰を含むプロジェクトに取り組んでいます。数値フィールドとカテゴリ フィールドが混在しています。カテゴリ値は序数です (銀行名、口座タイプなど)。数値型は、たとえば給与や年齢です。また、いくつかのバイナリ タイプ (男性、女性など) もあります。
KNN 分析にカテゴリ値を組み込むにはどうすればよいですか?
私の知る限り、各カテゴリ フィールドを数値キーに単純にマップすることはできない (例: バンク 1 = 1、バンク 2 = 2 など) ため、カテゴリ フィールドを使用するためのより良いアプローチが必要です。2 進数を使用できると聞きましたが、これは実行可能な方法ですか? アドバイスをいただければ幸いです。