オフライン手書き認識プログラムの一部として、0 から 9 までの数字の約 100 人によって書かれた手書きの数字の大きなセットがあります。プログラムで各画像を分類する前に、少し前処理を行いたいと考えています。それらをより標準的な形で入手してください。
現在、すべての画像は 1 と 0 (白の場合は 0、黒の場合は 1) で構成される 64x64 のグリッドですが、手書きスタイルの違いにより、一部の数字は他の数字より大きく、一部は異なる位置に配置され、一部は奇数の傾斜があります (人が対角線として描いたように)
それらをすべて同じ中心に移動し、ほぼ同じサイズにする方法をすでに大まかに把握しており、スキュー/傾斜を修正するには、それらを一定量回転させる必要があることを知っています。問題は次のとおりです。画像を回転させる量をどのように知ることができますか? 私たちのリソースには、それを理解するために指摘できる標準アルゴリズムがありますか?