問題タブ [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
iphone - iPhone Tesseract lib エラー
hereからtesseractコードを複製し、4.3のiphone OCRデモを構築しました
以前にtesseractにいくつかの問題があったことは知っていますが、私の問題は同じではないと思います。
アプリケーションは正常に起動し (シミュレーター)、[画像ピッカーを表示] ボタンをクリックするとUIImagePicker
、画像を選択できるようになります。画像を選択すると、「OCRDEMO - working」アラートが 1 ~ 2 秒間表示され、アプリがクラッシュし、次のデバッガー出力が表示されます。
iPhone に存在しないシステム ライブラリ内のシンボルを呼び出そうとする試みが検出されました: 画像 OCRDemo 内の関数 _Z17edges_and_textordPKcP10BLOCK_LIST から呼び出される clock$UNIX2003。gdb 内でシミュレータ バイナリを実行しているときにこの問題が発生した場合は、最初に「start-with-shell をオフに設定」してください。
「start-with-shell をオフにする」方法を正確に知らないことは役に立ちません。
エラーの主要コンポーネントの検索が不十分であるため、これは 4.3 によって引き起こされた問題ではないかと心配しています。
android - androidを使用して画像内のテキストを抽出するためにtesseractを使用しているときにエラーが発生しました
androidtesseractツールを使用してandroid用のtesseractocrを構築しましたが、すべてうまくいきました。ライブラリファイルも入手しました。Javaラッパーを使用してネイティブメソッドにアクセスしようとすると、デバイスがクラッシュします。カメラのコールバックで直接tesseractを使用しています。
コードは次のようになります。
tba.getUTF8Text()
ログをチェックインしましたが、デバイスがクラッシュしたため、setimageは正常に機能しています。
android - Android での画像のバイト表現のピクセルあたりのバイト数
現在、OCR を使用する必要がある Android アプリケーションを作成しています。
これを達成するために、 tesseract-android-tools プロジェクトと組み合わせて Tesseract を使用しています。
Tesseract API を初期化することができたので、次の setImage 関数を使用する必要があります。
私が苦労しているのは、bpp (ピクセルあたりのバイト数) と bpl (1 行あたりのバイト数) の正しい値を取得する方法です。これらの値を取得する方法を知っている人はいますか? 現時点ではかなりランダムな値を入力しており、後でエラーが発生すると考えています。
アプリケーションは画像認識に JavaCV も使用しており、画像を正常に認識しており、この tesseract 呼び出しに同じソースの画像データを使用していることに注意してください。
ありがとう。
performance - tessearctのスピードアップ
スキャンしたPDFファイルからテキストを抽出するためにLinuxでtesseract(Ver 3)を使用しています。プロセス全体が遅い、非常に遅いという問題。たとえば、これを抽出する(http://www.a-pdf.com/scan-paper/a-pdf-scan-paper-doc.pdf)20ページのドキュメントは514秒(8分以上)かかります
PDFを変換するには、ImageMagick変換アプリケーションを使用しました。以下のsetコマンドを使用します。
convert -density 288 src.pdf -colorspace Grey -depth 8 -alpha off tmp.tif
tesseract tmp.tif out.txt
tesseractは、テストしたスキャンファイルからテキストを完全に抽出できないため、288dpiが必要であることに注意してください。
結果の品質に影響を与えることなく、どうすればスピードアップできるか知っている人はいますか?
python - OCR テキストから段落区切りを抽出していますか?
次のように、OCR された画像テキストの出力から段落とインデントを再作成しようとしています。
入力(これは入力ではなく画像だと想像してください):
出力(いくつかの間違いがあります):
ご覧のとおり、段落の区切りやインデントは保持されません。
Python を使用して、次のようなアプローチを試みましたが、うまくいきません (頻繁に失敗します)。
コード:
このレイアウトを再現する方法について何か提案はありますか? 私は古い本を扱っているので、Python スクリプトを作成するのは非常に簡単なので、LaTeX でそれらを再植字したいと思っていました。
ありがとう!
android - Android : SIGSEGV シグナル JNI をキャッチ
イメージを文字列に変換するためにtesseractプロジェクトを使用しています。ただし、SIGSEGV シグナルは JNI から (ランダムに?) 送信されます。
シグナルが送信されたときにアプリを再起動したかったのですが、Java でシグナルを「キャッチ」する解決策が見つかりませんでした。
誰にも提案がありますか?
ありがとう
iphone - アプリはiOS4.1以降でクラッシュしますが、4.0では正常に動作します
Tesseractライブラリなどのサードパーティライブラリを使用するアプリケーションがあります。このアプリケーションは、SDK4.0を使用してXcode3で開発され、完璧に機能しました。しかし、数日前、XcodeとSDKをアップグレードすることにしました。そこで、SDK4.3とともにXCode4.0.2をインストールしました。確かに、アップグレード後、SDK4.3を使用してTesseractを含むすべての依存ライブラリを再構築しました。ビルド中にエラーは発生しませんでした。SDK4.0でのビルド時と同じようにすべてが同じでした。しかし、シミュレーター(4.1、4.2、4.3)でアプリを実行すると、次のエラーが発生します。
iPhoneに存在しないシステムライブラリでシンボルを呼び出そうとしていることを検出しました:画像APP_NAMEの関数_ZN9tesseract15TessdataManager4InitEPKciから呼び出されたfopen$UNIX2003。gdb内でシミュレーターバイナリを実行しているときにこの問題が発生した場合は、最初に「start-with-shelloff」を設定してください。
また、iOS 4.3を搭載したデバイスで試してみましたが、アプリが同じ場所でクラッシュするだけです。
ただし、アプリはシミュレーター/デバイス4.0で引き続き正常に動作します。
問題が何であるか、そしてiOS 4.1以降でアプリを実行可能にする方法を誰かが知っていますか?
ios - Tesseract iOS の英語以外の言語
Tesseract オープン ソース コードを使用して、iPhone で英語の文字をコンパイルして認識できるかどうかを確認しようとしています。私はそうすることができました。ここで、「ita.traineddata」を tessdata 内に含めて変更しようとしました
に
しかし、私はこのエラーが発生します:
Error openning data file /var/mobile/Applications/A37DB8B7-2272-4F80-9836-0034CEB56CC5/Documents/tessdata/ita.traineddata
何が欠けていますか?これをどのように処理する必要がありますか?
iphone - XCODE プロジェクト (IPHONE) の tesseract の構成
tesseract をダウンロードして構成し、いくつかの .a ファイルも取得しました。しかし、フレームワーク ファイルを追加して XCODE プロジェクトを実行すると、フレームワーク ライブラリから多くのエラーが発生します ???!!
xcodeで動作するtesseractのインストールと構成の手順について、誰か詳しく説明してもらえますか?