Tesseract Libs
私はここで見たように、tess-two
プロジェクトで、を使用してAndroidアプリケーションを開発するためにOCRを使用しています:http: //gaut.am/making-an-ocr-android-app-using-tesseract/
アプリは正常に動作しましたが、写真のコンテンツとともに返された文字列に、見知らぬ人のキャラクターが含まれている場合があります。例:私はこれを読んでいます:www.caelum.com.br
そして次のようなものを受け取ります:r ' . ,wlñzf . 94' kzl 5. vsmNs/.caelumcombr
検索、私はこれを構成しました:baseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");
しかし、それは最悪になると思います。
ポルトガル語と英語のテキストを読みたいです。それで、私は各言語の訓練されたデータをダウンロードして、私が望むようにそれを使用しました、しかしこれらの見知らぬ人のキャラクターはエンコーディングプロジェクトと関係がありますか?
手伝ってくれてありがとう :)