問題タブ [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - TesseractとPhpocr
Tesseractを使用して多数の画像ファイルをテキストに変換したいと考えています。
私は彼らのドキュメントを見ましたが、それがPHPにどのように関連しているか、そして私のphpスクリプトがtesseractocrとどのように相互作用するかを知りません。php exec()が道かもしれないことを示唆する他の質問を見てきました。
tesseractをダウンロードしてインストールしました。最新バージョンのxamppがインストールされたWindows7の使用。私はPHPの初心者から中級者の知識があります。私はどのような知識を欠いていますか?
更新私は今それをpowershellとcmdで動作させています
しかし、私が次のようにexecを介して実行しようとすると:
tesseract.exeが機能しなくなったことを示すポップアップがWindowsから表示されます。誰かにとって何か意味がある場合のエラーの詳細は次のとおりです。
python - PythonアプリケーションからTesseractOCRを使用した場合のパフォーマンスの問題
最近、検索可能なドキュメントをスキャンして、ドキュメント管理システムであるKnowledgeTreeにアップロードするためのインターフェイスをまとめました。このプロセスのさまざまな部分に対応する多数の個別のツールにアクセスできますが、ユーザーが物事をシンプルに保つために、すべてを1つのインターフェイスに統合したいと思いました。
プラットフォームは次のとおりです。
そして、これが基本的なプロセスです:
ステップ2が特定の種類のドキュメントで非常に遅いことを除いて、それは美しく機能します。基本的な固定幅のテキストレポートを順番に表示しますが、ロゴ、線、その他の判読できないコンテンツをいくつかスローし、1ページに数分かかる場合があります。向きを変えようとすると、それを最大4回繰り返す可能性があることは言うまでもありません。それに比べて、スキャナーに同梱されているソフトウェアはABBYY OCRを使用しており、ページレイアウトとテキストの向きをほぼ完全に処理して、1分以内に50ページ以上を処理できます(ABBYYに費用がかかるのはそのためです)。残念ながら、このスキャンソフトウェアの使用はユーザーにとってより複雑であり、それ自体で手順1〜3しかカバーしていません。
私の質問は、おそらくOCR /アップロードをスキャンインターフェイスから完全に分離することによって、これに別の方法でアプローチする必要があるかどうか、Pythonアプリケーションに統合できるOCRパッケージまたは他のソリューションを見落としているかどうかです。作業を行うために外部アプリケーションを呼び出しているという事実は、パフォーマンスの問題を引き起こしますか?
ここで何をするにしても、アップロードされた各ドキュメントのタイプとメタデータを手動で設定するようにユーザーに要求することは問題になる可能性があるため、ステップ4を制御できることが重要です。
.net - Tessnet2 for .Net - tessocr.Init 呼び出しで終了します
Visual Studio 10、Windows Vista Home Premium で .net コンソール アプリを実行しています。tessnet2 の例を動作させようとしています。ここに私のコードがあります:
アプリケーションは、tessocr.Init 呼び出しでコード 1 で終了します。
アプリケーションのデバッグ ディレクトリに 9 つの eng 言語ファイルをすべて配置しました。
他に何ができるかわかりませんか?
android - Android NDK を介して tesseract をコンパイルする
Android ndk r5 を使用して Android 用の tesseract をコンパイルしようとしています。tesseract のコードはhttps://android.googlesource.com/platform/external/tesseractをチェックアウトすることで取得されます。tesseract をコンパイルできず、エラーが発生しました。
私のandroid.mkは、libjpegがLOCAL_STATIC_LIBRARIESに含まれているこのように見えます
Android用のtesseractを構築するのを手伝ってください。
concurrency - Tesseract(OCRエンジン)は再入可能ですか?
クアッドコアプロセッサでTesseractを使用してOCRを実行しています。速度を上げるために、4つのスレッドを使用して一度に4つの単語を読みたいと思います。複数のスレッドから同時にTesseractを呼び出すのは安全ですか?
注:各スレッドは、異なる非共有イメージで動作します。
注:速度が原因で、ロックによる保護は適切ではありません。
iphone - iPhoneの番号認識はリアルタイムで可能ですか?
iPhoneのカメラ画像からリアルタイムで数字を認識する必要があります。画像に5桁以下しかないことはわかっています。
iPhone の計算仕様を考えると、この問題を解決するのは現実的ですか? Tesseract OCR ライブラリを使用した経験のある人はいますか?それを使用することで解決できると思いますか?
c# - Tesseract OCR ライブラリ - 学習フォント
さて、私はこのOCRのコンパイルされた.NETバージョンを使用しています。これは@ http://www.pixel-technology.com/freeware/tessnet2/で見つけることができます
私はそれを機能させていますが、これの目的はナンバープレートを翻訳することです.悲しいことに、エンジンは実際にはいくつかの文字を正確に翻訳しません.たとえば、これは文字の問題を特定するためにスキャンした画像です.
結果:
12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ
したがって、次の文字は正しく変換されていません。
1、O、Q、W
これはそれほど悪くはないようですが、私のナンバープレートでは、結果はそれほど良くありません:
= H4 ODM
= LDH IFW
偽のテスト
= NR4 y2k
お分かりかもしれませんが、ノイズ リダクション、コントラストの増加、完全な黒ではないピクセルの削除を試しましたが、実際の改善は見られませんでした。
エンジンの新しいフォントを「学習」できるようですが、ライブラリを .NET 用に再コンパイルする必要があると思います。これは、私が持っていない Linux OS で実行されているようです。
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
だから私は次に何をしようか迷っています。誰かがそれを試してみたいと思っている場合に備えて、純粋にテスト目的で簡単なコンソールアプリケーションを書きました。アイデア/グラフィック操作/ライブラリの考えがある場合は、聞いていただければ幸いです。
ocr - 小さなフォントでtesseractOCRを改善する方法はありますか?
python-tesseractを介してtesseract-OCRを使用して、次のような低解像度のフォントを読み取ろうとしています。
残念ながら、その画像は返されます
解像度が低すぎて問題が発生していると思います。画像を拡大して個々の文字に切り抜いてみましたが、どちらもあまり改善されていません。他に検討すべきことはありますか?できればPython Imaging Libraryを使用して実行できることはありますか?または、私は正八胞体をあきらめる/訓練する必要があります。
その価値のために、PILには次の組み込みフィルターがあります。
BLUR、CONTOUR、DETAIL、EDGE_ENHANCE、
EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、
SMOOTH、SMOOTH_MORE、およびSHARPEN
ocr - 文字が混在している場合、tesseractに数字のみを認識させるにはどうすればよいですか?
tesseract
数字だけを認識したい。問題は、数字と文字が混在していてSetVariable("tessedit_char_whitelist", "0123456789")
、すべてのシンボル tesseract に使用すると間違った数字が返されることです。
tesseract
類似性の低いシンボルを除外する ようにしきい値を設定できますか?
注: tesseract
O と 0 を混同しないように、数字のみを認識するように設定しました。
ocr - ノイズの存在下で関連する結果を与えるために正八胞体を作る方法は?
私はtesseract3.0.0を使用していますが、次の問題にぶつかりました。
tesseractが認識するには小さすぎるものがある場合、それは他のフラグメントとマージされているように見えます。その結果、関連するものは何も返されません。
下の画像は3つのケースを示しています。破線の長方形のみがtesseractに渡されます。長方形の上に結果があります(V over Tは改行を意味します)。
最後のケースは問題の1つです。このような状況で正八胞体を改善する方法はありますか?