問題タブ [ocr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
testing - OCRソフトウェアに成功の最高のチャンスを与える方法は?
アプリケーションの自動テストにTesseractOCR(pytesser経由)とPIL(Python Image Library)を使用しています。
スクリーンショットを作成し、tesseractのおかげでテキストを取得して、表示されたテキストに問題がないことを確認しています。
最初はいくつか問題がありましたが、PILのバイキュービック補間のおかげでスクリーンショットのサイズを大きくしたので、うまく機能しているようです。
残念ながら、「0」と「O」の混同など、まだいくつかの間違いがあります。将来、他にも同様の問題が発生することが想像できます。
OCRを支援するために画像を準備するためのいくつかのテクニックがあるかどうか知りたいです。どんなアイデアでも大歓迎です。
前もって感謝します
asp.net - ASP.Net Web アプリケーションで MODI を使用するにはどうすればよいですか?
Microsoft Office Document Imaging COM API の OCR ラッパー ライブラリを作成しました。ローカルで実行されているコンソール アプリでは、すべてのテストで問題なく動作します。
悲しいことに、IIS6 の下で ASP.Net Web アプリケーションとして実行されている WCF サービスと統合しようとすると、うまくいきません。MODI COM オブジェクトを解放しようとする際に問題がありましたが、ウェブ上に参考になる例がたくさんありました。
しかし、問題はまだ残っています。IIS を再起動し、Web アプリを新たに展開すると、最初の数回の OCR 試行はうまく機能します。30 分ほど放置してから別のリクエストを行うと、次のようなサーバー障害エラーが発生します。
サーバーが例外をスローしました。(HRESULT からの例外: 0x80010105 (RPC_E_SERVERFAULT)): MODI.DocumentClass.Create (String FileOpen) で
この時点から、IIS をリセットするまで、すべての要求は OCR を実行できず、サイクルが再び開始されます。
このアプリケーションは独自のアプリケーション プールで実行され、ローカル管理者権限を持つ ID の下で実行されます。
更新: この問題は、OCR をアウト プロセスで実行することで解決できます。MODI ライブラリはマネージ コードとうまく連携していないように見えるので、OCR リクエストごとに新しいプロセスを生成すると、私の状況ではうまくいきました。
OCR を実行する関数は次のとおりです。
次に、using ブロック内で ImageReader のインスタンスをインスタンス化します (終了時に IDisposable.Dispose を呼び出します)。
Marshal.FinalReleaseComObject を呼び出すと、CLR に COM オブジェクトを解放するように指示されます。そのため、発生している症状の原因を突き止めることができません。
価値があるのは、このコードを IIS の外部で、たとえばコンソール アプリで実行すると、すべてが防弾のように見えることです。毎回動作します。
この問題を診断して解決するのに役立つヒントは、非常に役立ちます。私は狂ったように賛成します! ;-)
ありがとう!
image-processing - OCR-最も「異なる」または「認識可能な」ASCII文字?
最も「異なる」または「認識可能な」NASCII文字を判別する方法を探しています...たとえば、N = 10の場合、0x21から0x7EまでのASCIIセットで最も異なるN文字は何でしょうか。明らかに、文字「X」は「O」(文字)とは非常に異なりますが、「O」(文字)は「0」(ゼロ)に非常に似ています。ゼロと文字Oがどちらか一方としてのみ検出され、それがゼロか文字Oかを心配する必要がないなど、制限されたOCR文字サブセットを想定すると、最も異なるNは何になりますか一般的なOCRエンジン(Tesseractなど)が低品質の入力画像から簡単に認識できる文字はありますか?仮定。「+」や「t」などは、大きく誤解される可能性があります。作ることができます、
ありがとう、ベン
java - Javaで画像ファイルからテキストを読み取る
画像(JPEG、PNG)ファイルからテキストを抽出するために使用できる最高のオープンソースJavaライブラリは何ですか?
text - プロットからテキストを抽出するのに最適なOCR?
(出典: goldprice.org )
この画像をテキストに変換できる優れた ocr を知っている人はいますか? tesseractを試しましたが、期待どおりに動作しませんでした。
xml - 外部OCRを既存のPDFに埋め込む方法は?
OCRアプリケーションを実行するための一連の画像があります。このプロセスにより、文字オフセットを含むXMLファイルが作成されます。次に、Acrobat 9を使用して画像をPDFに変換します。次に、検索可能なPDFを実現するために、XMLファイル情報を非表示のテキストレイヤーとしてPDFに追加します。簡単で自由な方法はありますか?
いくつかの詳細:
AcrobatのOCR機能を使用したくありません。
OCRプロセスにより、次のような要素を含むXMLファイルが作成されます。
<line baseline="1049" l="158" t="1012" r="1196" b="1060">This is a sample line of text from an image</line>
更新:私がやりたいことを別の方法で行うことが可能かもしれません。一連の画像から生成されたPDFファイルがすでに存在し、その中にOCRedテキストがすでに含まれているとします。(おそらくプログラムで)各ページの画像だけにアクセスし、それを処理して(たとえば、モノクロに変換して)、PDFファイルに保存することは可能でしょうか?はいの場合、OCRedテキストは失われません。
[この更新を別の質問に入れる必要がありますか?]
search - PDFに画像のみが含まれているか、検索のためにOCRスキャンされているかを知るにはどうすればよいですか?
スキャンしたドキュメントからのPDFファイルがたくさんあります。ファイルには、画像とテキストが混在しています。一部はOCRなしの画像としてスキャンされたため、ページ全体が完全にテキストである場合でも、各PDFページは1つの大きな画像になります。その他はOCRでスキャンされ、テキストが存在する場所に画像と検索可能なテキストが含まれています。多くの場合、画像内の単語でさえ検索可能になりました。
Acrobat 8 ProでOCRを使用して、スキャンしたすべてのドキュメントのテキストを認識する自動プロセスを作成したいのですが、過去にOCRプロセスを経たファイルを再OCRしたくありません。画像のみが含まれているものと、検索可能なテキストがすでに含まれているものを判別する方法があるかどうかを誰かが知っていますか?
これをC#またはVB.NETで実行することを計画していますが、2種類のファイルを区別できるかどうかは言語に依存するとは思いません。
vb.net - VB.net を使用して PDF をテキスト ファイルに変換する
スキャンした PDF ファイルがあります。スキャンした PDF をテキスト形式に変換する VB.net ソース コードが必要です。
c# - スクリーン スクレーパー アプリケーション (HTML 以外)
pdf - まだOCRされていないPDFをバッチOCRする
10,000 個の PDF があり、そのうちのいくつかは OCR されており、そのうちのいくつかには OCR されたページが 1 つありますが、残りのページは OCR されていません。行われて?