こんにちは、手書きのOCR分類ニューラルネットワークで使用するのに適した機能について、研究論文を検索しています。私は初心者なので、手書き文字の画像を取り、その周りにバウンディング ボックスを作成し、それを 15x20 のバイナリ画像にサイズ変更しました。これは、300 個のフィーチャの入力レイヤーがあることを意味します。私がグーグルで見つけた論文(そのほとんどはかなり古いものです)から、方法は本当に異なります。私の精度は画像のバイナリ グリッドだけでは悪くありませんが、精度を上げるために使用できる他の機能を誰かが持っているかどうか疑問に思っていました。または、私を正しい方向に向けるだけです。とても感謝しております!
ありがとう、ザック