問題タブ [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - OCR with the Tesseract interface
How do you OCR an tiff file using Tesseract's interface in c#?
Currently I only know how to do it using the executable.
fonts - OCRに最適なフォントは何ですか?
OCR 用にさまざまなフォントを使用した経験のある人はいますか? ID を生成してから、tesseract でスキャンしようとしています。現時点では、私はさまざまなフォントを T&E で使用していますが、これはかなり非効率的です。私は OCR* ファミリーのフォントと、Arial や Georgia などのさまざまなフォントを試しました。tesseract は、OCR* フォントと混同される傾向があります。
tesseract 用に特別に設計されたフォント、またはそれとうまく動作するシステム フォントはありますか?
java - コマンドラインからの呼び出しと JNI からの呼び出し
Java アプリケーション サーバーから tesseract OCR (光学式文字認識を行う C++ のオープン ソース ライブラリ) を呼び出す必要があります。現在、Runtime.exec() を使用して実行可能ファイルを実行するのは簡単です。基本的なロジックは
- 現在メモリに保持されているイメージをファイル (.tif) に保存します。
- イメージ ファイル名を tesseract コマンド ライン プログラムに渡します。
- FileReader を使用して Java から出力テキスト ファイルを読み込みます。
Tesseract 用の JNI ラッパーを作成することで、パフォーマンスがどの程度向上する可能性がありますか? 残念ながら、Linux で動作するオープン ソースの JNI ラッパーはありません。私は自分でそれをしなければならず、その利益が開発コストに見合うかどうか疑問に思っています.
c++ - 画像を300DPIに拡大するにはどうすればよいですか?
画像認識用のC++ライブラリの質問に対する受け入れられた回答:文字列への単語を含む画像は、次のことを推奨しました。
- 入力画像を300DPIにアップサイズ/ダウンサイズします。
これをどのように行うか...DPIは画像形式ではなく、モニター用であるという印象を受けました。
testing - OCRソフトウェアに成功の最高のチャンスを与える方法は?
アプリケーションの自動テストにTesseractOCR(pytesser経由)とPIL(Python Image Library)を使用しています。
スクリーンショットを作成し、tesseractのおかげでテキストを取得して、表示されたテキストに問題がないことを確認しています。
最初はいくつか問題がありましたが、PILのバイキュービック補間のおかげでスクリーンショットのサイズを大きくしたので、うまく機能しているようです。
残念ながら、「0」と「O」の混同など、まだいくつかの間違いがあります。将来、他にも同様の問題が発生することが想像できます。
OCRを支援するために画像を準備するためのいくつかのテクニックがあるかどうか知りたいです。どんなアイデアでも大歓迎です。
前もって感謝します
android - Androidでtesseractを使用する
私はtesseract OCRエンジンを使用するAndroidプロジェクトに取り組んでいます..過去数日から、Androidプラットフォームのtesseractのサポートについてインターネットで検索しています..しかし、私は何の助けも得られませんでした. Androidプラットフォームにtesseractを使用する...またはAndroidにインストールするにはどうすればよいですか..
どんな種類の助けも非常に高く評価されています...事前に感謝を助けてください
c++ - MagickWand オブジェクト (C) から libtiff TIFF オブジェクトを取得するにはどうすればよいですか?
MagickWand オブジェクト (C) から libtiff TIFF オブジェクトを取得するにはどうすればよいですか?
ImageMagick で任意の画像タイプを開き、tesseract を実行したいと考えています。Tesseract は IO に libtiff を使用しているようで、ImageMagick は tiff 処理に libtiff を使用しているようです。
ありがとう、チェンツ
php - PHPを使用してtesseract-ocrをインストールして起動するにはどうすればよいですか?
phpを使用してテキストの画像を文字に変換するOCRコンポーネントを探しています。
googlecodeからスクリプトtesseract-ocrを入手しました。PHPを介してtesseract-ocrをインストールして起動するにはどうすればよいですか?
私はPHPの初心者なので、彼らが提供したドキュメントを思い付くことができません。インストールして起動するための簡単な手順が必要ですか?前もって感謝します。
embedded - ARM / Gumstixでtesseract-ocrをコンパイルしますか?
特定のGumstixボードにあるIntelPXA270用にtesseract-ocrをコンパイルすることは可能ですか?誰かがこれを成功させましたか?もしそうなら、どのようにそうしましたか?
.net - Tessnet2 を使用する .NET アプリケーションが失敗する
Tessnet2を使用するアプリがあります。Init メソッドを呼び出そうとすると、アプリケーションが失敗します。
失敗はひどいものです - 例外 (ANY) も、エラーの痕跡も、「レポートの送信」ウィンドウさえもありません。アプリのプロセスがちょうど削除されました。
問題のあるコードは次のとおりです。
役立つかもしれないいくつかのメモ:
- Tessnet2 には、Visual C++ 2008 ランタイムが必要です。msvcm90.dll か msvcm80.dll かは不明です。
- アプリケーションはデスクトップ WPF です。
- 開発環境: VS 2008 SP、.NET 3.5 SP1
- 以前は機能していました (SOAP Web サービスを使用するために Web 参照を追加したと思いますが、それを削除しようとしても結果はありませんでした)。
- 単体テストは完全に機能しており、障害は発生していません。
これらの観察から、WPF アプリケーション自体に問題があるように思えます。
私が持っている唯一の情報は、デバッグ中の出力です。
そして、アプリが失敗したときの最後のピース:
更新:イベント ログを確認しました。「SideBySide」ソースのエントリはありません。この問題に関連するエントリのみを以下に示しますが、残念ながら多くはわかりません。
ヒントをお寄せいただきありがとうございます。