1

オフライン手書き認識プログラムの一部として、0 から 9 までの数字の約 100 人によって書かれた手書きの数字の大きなセットがあります。プログラムで各画像を分類する前に、少し前処理を行いたいと考えています。それらをより標準的な形で入手してください。

現在、すべての画像は 1 と 0 (白の場合は 0、黒の場合は 1) で構成される 64x64 のグリッドですが、手書きスタイルの違いにより、一部の数字は他の数字より大きく、一部は異なる位置に配置され、一部は奇数の傾斜があります (人が対角線として描いたように)

それらをすべて同じ中心に移動し、ほぼ同じサイズにする方法をすでに大まかに把握しており、スキュー/傾斜を修正するには、それらを一定量回転させる必要があることを知っています。問題は次のとおりです。画像を回転させる量をどのように知ることができますか? 私たちのリソースには、それを理解するために指摘できる標準アルゴリズムがありますか?

4

1 に答える 1

0

各画像のピクセルに主成分分析アルゴリズムを適用することを検討します。これにより、線の2つの主な方向が得られるはずです。その後、対応する座標フレームに従って回転できます。

于 2011-10-21T17:15:34.887 に答える