プロジェクトのゲーム ボードから文字を抽出しようとしています。現在、ゲーム ボードを検出し、それを個々の正方形に分割し、すべての正方形の画像を抽出できます。
私が得ている入力は次のようなものです(これらは個々の文字です):
最初は、画像ごとの黒いピクセルの数を数え、それをさまざまな文字を識別する方法として使用していました。これは、制御された入力画像ではある程度うまくいきました。ただし、私が抱えている問題は、これらとわずかに異なる画像に対してこれを機能させることができないことです。
トレーニングに使用する各文字のサンプルが約 5 つありますが、これで十分なはずです。
これに使用するのに適したアルゴリズムを知っている人はいますか?
私のアイデアは(画像を正規化した後):
- 画像とすべての文字画像の違いを数えて、どれが最小量のエラーを生成するかを確認します。ただし、これは大規模なデータセットでは機能しません。
- コーナーの検出と相対位置の比較。
- ???
どんな助けでも大歓迎です!