オープン ソースの c++ ocr ライブラリを探しています。Symbian/Meego アプリケーションに使用したい。どれかお勧めできますか?http://code.google.com/p/tesseract-ocr/を見つけました。しかし、それが良い選択であるかどうか、また Qt アプリでどのように使用するかはわかりません。教えてもらえますか?
1 に答える
いくつかのアプローチがあります:
Tesseract(http://code.google.com/p/tesseract-ocr/)、これはオープンソースであり、無料のOCRエンジンの中で最高と見なされています。設定がかなり難しく、フォントのトレーニングと画像の前処理の開発が必要です(電話カメラからのOCRには、ノイズリダクション、遠近法の補正、ワープとスキューの処理などが必要になることがよくあります)。
ABBYYモバイルOCRエンジンの詳細については、この質問を参照してください:iPhone用ABBYYモバイルOCRエンジン
もう1つの解決策はCloudSDKです。これは、画像をアップロードし、Web APIを介してOCRedデータを送り返すことができるWebサイトです。モバイルOCRについては、www.ocrsdk.comを参照してください。画像の前処理とOCRは非常にリソースを消費するプロセスであるため、ミッドレベルおよびローエンドのモバイルデバイス(シンビアンが含まれている可能性が高い)で作業する場合に役立つことがあります。そのため、同様に試してみることをお勧めします。
Tesseractエンジンはオープンソースですが、ABBYYは比類のないOCR品質を提供し、はるかに使いやすくなっています。商用プロジェクトを計画している場合は、ABBYYを試してみてください。これにより、製品に深刻な価値がもたらされます。無料/オープンソース/研究プロジェクトを開発している場合-tesseractがあなたの選択です。私は@ABBYYで働いており、必要に応じて追加情報を提供できます。