だから私は画像のパターン(数字の4など)を認識できるようにしたいのですが、さまざまなアルゴリズムについて読んでいて、最近隣人アルゴリズムを本当に使いたいと思っています。 : http://people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html 問題は、欠落しているデータセットを埋めるためにそれを使用する方法は理解していますが、画像形状認識を目的としたパターン認識ツールとして使用する方法がわかりません。このアルゴリズムがパターン認識でどのように機能するかについて、誰かが光を当てることができますか? OpenCV を使用したチュートリアルを見たことがありますが、自分で前処理を行う能力があるため、このライブラリを実際に使用したくありません。単純な最近傍であるべきもののためだけにこのライブラリを実装するのはばかげているようです。アルゴリズム。
3 に答える
単に (単純に?) データの「距離」の尺度を定義する必要があります。
大きな画像を小さな画像に分割し、それぞれが分類したいテキスト文字に対応していると仮定しましょう。デジタルモノクロ画像を扱っていると仮定すると、各画像は (たとえば) 0 ~ 255 の整数範囲 (明るさ) の値 (ピクセル) の長方形のマトリックスとして表されます。また、すでに適切に分類された画像 (トレーニング セット) が多数あることも前提としています (NN は「教師あり分類アルゴリズム」です)。
新しい小さな画像が与えられた場合、2 つの画像間の距離を定義して、トレーニング セット内で最も近いものが選択され、その「ラベル」が認識されたテキスト文字として選択されるようにする必要があります。
単純なアプローチの 1 つは、ピクセルの差 (たとえば、平方和) を取ることです。しかし、この距離測定は平行移動 (および回転とスケーリング) の影響を受けやすく、通常はそれを望んでいません。別の方法として、変換不変であるフーリエ変換のモジュラスを計算することもできます (ただし、これでは十分ではありません)。ここから始めることができます - そして、問題が難しく、この種の分類を許容できるように実行するには多くの作業が必要であることを認識してください。