そのため、最終年度のプロジェクトでは、ユーザーが携帯電話から名刺の写真を撮り、それにOCRを適用して、必要なすべての情報を印刷可能な形式で取得できる、気の利いたlilアプリを作成しています...私の問題は、SIFTがローテーションであるということです。不変、つまり「u」と「n」および他のそのような単語や数字を区別することはできません。この問題を克服するために、皆さんが持っている、または思いついたアイデアを共有していただければ幸いです。:) ありがとうございました。
1665 次
3 に答える
0
その画像を取り除き、希釈を使用してみてください。それが機能しない場合は、ニューラルネットワークを使用してください。
于 2011-11-30T18:51:45.530 に答える
0
次の論文を見たことがありますか?:-)
SIFT機能を使用した筆記体パシュトゥー語スクリプトのスケールおよび回転不変認識
于 2011-11-30T21:18:15.980 に答える
0
SIFTでは「u」と「n」の類似した文字を処理するのが難しいのは事実ですが、本当にSIFTを使い続けたい場合(最終的なプロジェクトはおそらくこれで終了します...)、いつでも画像に前処理を適用できます。 'u'や'n'のように、下線を正しい方向に配置し、下線付きの'u'が'u'であることをSIFTに知らせます。
于 2013-01-15T16:52:21.210 に答える