0

図書館で本を認識するAndroidアプリケーションを作成しています。私がしていることは、本の本の背の画像を取り、それをサーバーに送信してそこで画像処理を行い、データベースから本を認識し、本に関する詳細を電話に送信することです。そこで、光学文字を認識し、モバイル アプリケーションに送信します。C#を使用して画像処理プロセスを実行したいと考えています。本の認識は、データベースにあるテンプレート画像と送信された画像を比較して行われます。したがって、これを行うための最良のアプローチは何かを理解するための助けが必要です。私はすでに次のようないくつかの方法について研究しています

  1. テンプレートマッチング
  2. パターン認識
  3. 特徴認識

本のような画像に関しては、私が従ったほうがよい推奨される方法を知りたい. また、これに適した API はありますか。私は OpenCV について調査しましたが、より良い API があるかどうかを知りたいです。また、本を認識するときに OCR を使用するにはどうすればよいですか。申請を早くしたい。通常、2 つの本の背表紙 (テンプレートと画像) を比較して、60% の類似性が得られれば、同じ本であると見なすことができます。最適な方法を模索中…!これで私を助けてください...!

4

2 に答える 2

3

私は画像処理の分野で限られた知識しか持っていませんが、そのような機能を提供するライブラリがあります: AForge.NETです。それは最初のリファレンスとしては良いかもしれません。

編集: 画像処理の背後にある理論の入門的な説明については、これもいくつかのガイダンスを提供する場合があります: http://www.societyyofrobots.com/programming_computer_vision_tutorial.shtml

于 2012-01-20T03:25:13.090 に答える
0

これを支援するAPIまたは「構築済み」の画像処理ライブラリを探しているとのことですが、この回答は、ある意味で、またはこのようなことを追求したい他の人々に役立つ可能性があります。

スタンフォードのこのモバイルビジュアル検索ページには、非常に役立つ研究論文(成功した実装からのテストを含む)がいくつかあります。そのページの「資産追跡のための本の背骨認識」という見出しを確認してください。

于 2013-02-07T15:44:58.517 に答える