問題タブ [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - 認識した文字の座標を取得する方法
私は Tesseract に基づく非常に単純な OCR アプリを持っています。認識ステップの後、OCR が間違っている場合に修正できるユーザー検証ステップも提供します。ユーザー インターフェイスを改善するために、元の入力画像の OCR 処理された文字の上に四角形を描画し、OCR 出力と並べて配置する予定です。そのためには、認識された文字の座標が必要です。
私はこのようなことを試しましたが、意味不明になるようです:
ここで、output->count にアクセスすると、10,000 を超える値が得られます。これは、画像全体に 20 文字程度しかないため、明らかに間違っています。
私は正しい軌道に乗っていますか?方向性を教えてください。
android - Android NDK を介して tesseract をコンパイルする
Android ndk r5 を使用して Android 用の tesseract をコンパイルしようとしています。http://code.google.com/p/tesseract-android-tools/ をチェックアウトすることで tesseract のコードが取得されます。tesseract をコンパイルできず、エラーが発生しました。
この問題を解決するのを手伝ってください。
ocr - 訓練用テッセラクト
いくつかの画像を認識するように tesseract をトレーニングしようとしていますが、マニュアルが明確ではありません。tesseract をトレーニングするためのシンプルでわかりやすいガイドを知っていますか?
ありがとうございました。
android - Tesseract Android ツールのクラッシュ エラー
クラスのinit メソッドでクラッシュ エラーが発生しTessBaseAPI
ました。これについて助けてください。ログ ファイルは次のとおりです。
xcode - Xcode での EXC_BAD_ACCESS エラー
私は本当にあなたの助けが必要です.Xcodeでプログラムを実行し、成功しましたが、後で、
次のエラーが表示されます: **スレッド 1: プログラムがシグナルを受信しました:"EXC_BAD_ACCESS"プログラム行で、以下に太字で示しています:
ありがとうございます。
performance - Tesseract / Tessnet2 の認識速度と精度を向上させるには?
スキャン エラーを制限するために、文字のホワイトリストを定義できることがわかりました。
しかし、bool numericMode の情報は見つかりませんでしたocr.Init(@"c:\temp", "fra", false);
数字のみをスキャンしたいとします。ホワイトリストを「0123456789」に設定すると、認識で最良の結果が得られますが、Init メソッドの numericMode パラメータは何をしますか? ホワイトリストが「0123456789」だったとしても、私はいつもそれが間違っているのを見てきました。
また、tessnet にフィードする画像に最適なビットマップ パラメータ (ピクセル形式) は何ですか。
tesseract - 接続された手書き認識エンジンを持つ最良の方法は何ですか?
接続されていない文字でtesseractをトレーニングしようとしましたが、うまく機能しています。
でも、文字がつながった手書き文字は認識できるのかな。
私はオープンソースの方法にもっと興味があります。
アイデアをありがとう。
c++ - 画像操作ライブラリ
主に色操作用のライブラリが必要です。画像を白黒にし、コントラストを増強して、Tesseract (Google OCR ライブラリ) が投げた画像をより適切に読み取れるようにしたいと考えています。
または、誰かが Tesseract の結果を改善する方法についてより良いアイデアを持っている場合、私はそれを支持します.
java - tesseract-android-tools (android) のトレーニング済みデータの読み込み
私はアンドロイドアプリに取り組んでいます。私が必要とするのは、訓練されたデータファイルへの直接パスです(初期テッセラクトへ)。最適なオプションのように見えますが、リソースを raw に設定することです。
この方法でリソース ID を取得しています (ファイル名は deu.traineddata です):
OK、'rID' > 0、現在 Stream を取得中:
わかりました、「です」!= null。しかし、「is」を読み取ることで問題が発生し、スタックトレースなしで IOException がスローされました。
asset からファイルを読み込もうとしましたが、InputStream から読み込んでも同じ問題です。私が間違っているのは、リソースパスを取得する他の方法はありますか? ありがとうアンドレイ
tesseract - C#でtesseractを使って他の言語を読む方法
c# で tesseract を実行しようとしています。このプログラムは、英語の 'ocr.Init(@"C:\Program Files\Tesseract-OCR\tessdata", "eng", false);' でうまく動作します。言語を「eng」から「ita」に変更しようとすると、プログラムでエラーが発生して動作しません。ディレクトリ「.../tessdata」には、「ita.traineddata」とその他のitaが含まれています。ファイル。ライブラリ tessnet2.dll を使用します。
ありがとう、アレッサンドロ。