私は、ヘブライ文字を認識するC#OCRプログラム(私自身の学習目的のプロジェクトであり、商業品質のものは何もありません)に取り組んでいます。これを行うには、画像からグリフを分離してから、テンプレートマッチングメソッドを適用します。
私がいるところ
画像から個々のグリフを分離できるようになりました。各グリフは、ピクセルの2D配列で表されます。たとえば、「bet」という文字は次のようになります。
..........
.*******..
.......*..
.......*..
.********.
..........
どこ "。" 空のスペースを表し、「*」は塗りつぶされたピクセルを表します。
これで、テンプレートマッチングアルゴリズムを適用して、この2Dピクセル配列が表すグリフを特定することになりました(この場合、「ベット」テンプレートと一致する必要があります)。
問題
優れたテンプレートマッチングアルゴリズムの簡単な説明を見つけるのに苦労していて(私が見つけたもののほとんどは論文またはコードライブラリへのリンクです)、誰かが私が勉強するかもしれないことを知っているかどうか疑問に思いました。
単にライブラリを使うのではなく、手作業でやりたいということを強調したいと思います。私は図書館がどのように問題を解決するかを研究したいと思っていますが、それが15億の異なる部分に分割されていない場合。:)
また、自分がやろうとしていることを実行するためのより良い方法があるかどうかも聞いてみたいと思います。