問題タブ [tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
56979 参照

c# - OCR with the Tesseract interface

How do you OCR an tiff file using Tesseract's interface in c#?
Currently I only know how to do it using the executable.

0 投票する
8 に答える
43946 参照

fonts - OCRに最適なフォントは何ですか?

OCR 用にさまざまなフォントを使用した経験のある人はいますか? ID を生成してから、tesseract でスキャンしようとしています。現時点では、私はさまざまなフォントを T&E で使用していますが、これはかなり非効率的です。私は OCR* ファミリーのフォントと、Arial や Georgia などのさまざまなフォントを試しました。tesseract は、OCR* フォントと混同される傾向があります。

tesseract 用に特別に設計されたフォント、またはそれとうまく動作するシステム フォントはありますか?

0 投票する
3 に答える
2407 参照

java - コマンドラインからの呼び出しと JNI からの呼び出し

Java アプリケーション サーバーから tesseract OCR (光学式文字認識を行う C++ のオープン ソース ライブラリ) を呼び出す必要があります。現在、Runtime.exec() を使用して実行可能ファイルを実行するのは簡単です。基本的なロジックは

  1. 現在メモリに保持されているイメージをファイル (.tif) に保存します。
  2. イメージ ファイル名を tesseract コマンド ライン プログラムに渡します。
  3. FileReader を使用して Java から出力テキスト ファイルを読み込みます。

Tesseract 用の JNI ラッパーを作成することで、パフォーマンスがどの程度向上する可能性がありますか? 残念ながら、Linux で動作するオープン ソースの JNI ラッパーはありません。私は自分でそれをしなければならず、その利益が開発コストに見合うかどうか疑問に思っています.

0 投票する
5 に答える
4015 参照

c++ - 画像を300DPIに拡大するにはどうすればよいですか?

画像認識用のC++ライブラリの質問に対する受け入れられた回答:文字列への単語を含む画像は、次のことを推奨しました。

  1. 入力画像を300DPIにアップサイズ/ダウンサイズします。

これをどのように行うか...DPIは画像形式ではなく、モニター用であるという印象を受けました。

0 投票する
4 に答える
1523 参照

testing - OCRソフトウェアに成功の最高のチャンスを与える方法は?

アプリケーションの自動テストにTesseractOCR(pytesser経由)とPIL(Python Image Library)を使用してます

スクリーンショットを作成し、tesseractのおかげでテキストを取得して、表示されたテキストに問題がないことを確認しています。

最初はいくつか問題がありましたが、PILのバイキュービック補間のおかげでスクリーンショットのサイズを大きくしたので、うまく機能しているようです。

残念ながら、「0」と「O」の混同など、まだいくつかの間違いがあります。将来、他にも同様の問題が発生することが想像できます。

OCRを支援するために画像を準備するためのいくつかのテクニックがあるかどうか知りたいです。どんなアイデアでも大歓迎です。

前もって感謝します

0 投票する
2 に答える
20519 参照

android - Androidでtesseractを使用する

私はtesseract OCRエンジンを使用するAndroidプロジェクトに取り組んでいます..過去数日から、Androidプラットフォームのtesseractのサポートについてインターネットで検索しています..しかし、私は何の助けも得られませんでした. Androidプラットフォームにtesseractを使用する...またはAndroidにインストールするにはどうすればよいですか..

どんな種類の助けも非常に高く評価されています...事前に感謝を助けてください

0 投票する
1 に答える
288 参照

c++ - MagickWand オブジェクト (C) から libtiff TIFF オブジェクトを取得するにはどうすればよいですか?

MagickWand オブジェクト (C) から libtiff TIFF オブジェクトを取得するにはどうすればよいですか?

ImageMagick で任意の画像タイプを開き、tesseract を実行したいと考えています。Tesseract は IO に libtiff を使用しているようで、ImageMagick は tiff 処理に libtiff を使用しているようです。

ありがとう、チェンツ

0 投票する
2 に答える
4894 参照

php - PHPを使用してtesseract-ocrをインストールして起動するにはどうすればよいですか?

phpを使用してテキストの画像を文字に変換するOCRコンポーネントを探しています。

googlecodeからスクリプトtesseract-ocrを入手しまし。PHPを介してtesseract-ocrをインストールして起動するにはどうすればよいですか?

私はPHPの初心者なので、彼らが提供したドキュメントを思い付くことができません。インストールして起動するための簡単な手順が必要ですか?前もって感謝します。

0 投票する
1 に答える
2023 参照

embedded - ARM / Gumstixでtesseract-ocrをコンパイルしますか?

特定のGumstixボードにあるIntelPXA270用にtesseract-ocrをコンパイルすることは可能ですか?誰かがこれを成功させましたか?もしそうなら、どのようにそうしましたか?

0 投票する
2 に答える
3272 参照

.net - Tessnet2 を使用する .NET アプリケーションが失敗する

Tessnet2を使用するアプリがあります。Init メソッドを呼び出そうとすると、アプリケーションが失敗します。
失敗はひどいものです - 例外 (ANY) も、エラーの痕跡も、「レポートの送信」ウィンドウさえもありません。アプリのプロセスがちょうど削除されました。

問題のあるコードは次のとおりです。

役立つかもしれないいくつかのメモ:

  • Tessnet2 には、Visual C++ 2008 ランタイムが必要です。msvcm90.dll か msvcm80.dll かは不明です。
  • アプリケーションはデスクトップ WPF です。
  • 開発環境: VS 2008 SP、.NET 3.5 SP1
  • 以前は機能していました (SOAP Web サービスを使用するために Web 参照を追加したと思いますが、それを削除しようとしても結果はありませんでした)。
  • 単体テストは完全に機能しており、障害は発生していません

これらの観察から、WPF アプリケーション自体に問題があるように思えます。

私が持っている唯一の情報は、デバッグ中の出力です。

そして、アプリが失敗したときの最後のピース:

更新:イベント ログを確認しました。「SideBySide」ソースのエントリはありません。この問題に関連するエントリのみを以下に示しますが、残念ながら多くはわかりません。

ヒントをお寄せいただきありがとうございます。