私は現在、数字の手書き認識問題に取り組んでいます。多くの最先端のアルゴリズムが、デスキューやジッタリングなど、mnist データセットにいくつかの前処理方法を採用していることがわかりました (「ジッタリング」とは何かはわかりません)。私は長い間グーグル検索しましたが、mnist dateset のデスキューに使用できる特定の方法やアルゴリズムについては何も見つかりませんでした。この問題を解決する方法についてアイデアを持っている人はいますか? どうもありがとう!
1673 次
2 に答える
1
傾き補正は、LeCun の 1998 年の論文 [ http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf]から取られています。
傾き補正は、ピクセルの二次慣性モーメント (前景ピクセルを 1、背景ピクセルを 0 としてカウント) を計算し、主軸が垂直になるようにラインを水平方向にシフトして画像を傾斜させます。
于 2016-10-08T12:40:32.057 に答える