0

私は K 最近傍分類器を構築しており、距離計算を一度に実行したいと考えています (ベクトル化されていないバージョンは実行に長い時間がかかるため、これも役に立ちます)。

サイズ 28000 サンプル x 784 フィーチャのテスト データセットと、サイズ 42000 サンプル x 784 フィーチャのトレーニング データセットがあります。私の質問に答えるコードは、サイズが 28000 x 42000 のマトリックスになるはずです。各行には、そのテスト例から 42000 個のトレーニング例のそれぞれまでの距離が含まれています。

私が思いついた最善の方法は、sum と bsxfun を使用して各テスト例のすべての距離を一度に計算することですが、それでも 28000 個の例すべてをループする必要があり、前述のように時間がかかります。

4

1 に答える 1

2

pdist2(A, B)必要なことを正確に実行します。トレーニングとテストデータセットはそれぞれどこAにありますか。B参照は次のとおりです:http: //www.mathworks.com/help/stats/pdist2.html

于 2013-01-08T00:46:37.057 に答える