問題タブ [tess4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
297 参照

java - javaでtesseractを使用しているときにset datapathエラーに直面する

PDFからテキストを認識するためにtesseractを使用していますが、奇妙なエラーに直面しています。エラーは、データ ファイル data/tessdata/eng.traineddata を開く際のエラーです。 TESSDATA_PREFIX 環境変数が "tessdata" ディレクトリの親ディレクトリに設定されていることを確認してください。

これで、このエラーの意味がわかり、パスがデータ フォルダーの親ディレクトリに更新されました。しかし、奇妙なことに、コードを実行したときにこのエラーがすぐに発生するわけではありませんが、10〜15個のpdf(それぞれ約40ページで構成されています)を認識した後にエラーが発生します。このエラーが発生し、プログラムが以前に停止した pdf からプログラムを再度実行すると、別の 10 ~ 15 個の pdf の読み取りでエラーは発生しません。

これは奇妙で、この背後にある理由がわかりません。誰かがこれに直面した場合、またはこの背後にある理由を知っている場合は、コメントしてください.

これは、pdf の特定のページからテキストを認識するために使用する関数です。すべてのpdfの各ページに対してこの関数を呼び出します。

誰かが異常なことを見つけたら、返信してください。

0 投票する
1 に答える
1516 参照

tesseract - Tess4j Tesseract 対 Tesseract1

Java api パッケージ Tess4J の Tesseract と Tesseract1 オブジェクトの違いを 100% 確信しているわけではありません。誰でも説明できますか?

Tesseract はインターフェイス マッピングを使用し、Tesseract1 はダイレクト マッピングを使用することは知っています。これにより、彼らの行動はどのように変化しますか?

前もって感謝します!

0 投票する
0 に答える
331 参照

java - Programmatically preprocess picture for parsing to OCR

I have an image where I crop on the region that I have set to recognize by ocr using tesseract. After all the image processing the result is like this Image before processing

When this image is given to do ocr, the result is not accurate like

Image 7_B7.bmp = W’ I WTH 3795 ’ _/ 7777777777” f ‘ .1.“ we)? 1

What I want to do is to make the image to be like this(edited in paint) Expected result of preprocessing

so that it will give more accurate result after recognition. What can I do to get image like this?

0 投票する
1 に答える
793 参照

tesseract - 「言語 'osd' の読み込みに失敗しました」というエラーが発生した Java の tess4j

コードを実行すると、2 つのエラーが発生します。

言語「osd」の読み込みに失敗しました

Tesseract はどの言語も読み込めませんでした!

tess4jが使用できる言語があることをどのように見つけるかわかりません

そして、itermで「tesseract --list-langs」を実行すると

結果は「eng osd」です

tesseract はうまく機能すると思いますが、tess4j が機能しないのはなぜですか

TESSDATA_PREFIX 環境変数を設定しました

echo $TESSDATA_PREFIX
出力: /Users/qwf/tessdata/3.04.01_1/

私は自作でtessdataをインストールします

0 投票する
1 に答える
5227 参照

java - 入力ソース設定エラー例外なし Tess4J

http://tess4j.sourceforge.net/から Tess4J をダウンロードし、netbeans にインポートしました。コードは実行中ですが、画像の URL を入力して変換しようとすると、エラーが発生します。

私のコード:

出力エラー:

他の誰かが以前にこのようなことを経験しましたか? stackoverflow でさらに 3 つの同様のトピックを見つけましたが、役に立ちませんでした..

0 投票する
1 に答える
240 参照

java - Tess4j と NetBeans Java Programm - 問題 "AWT-Eventqueue-0" unsatisfied-link-error

画像を取得し、tesseract を使用して画像からデータを抽出する小さなツールをプログラムしました。64 ビット Windows 7 マシンの Netbeans で Java を使用しました。これまでのところ、プログラムは完全に正常にコンパイルされ、tesseract を含め、私が望むことを実行します。しかし、Netbeans で完成したプロジェクトをクリーンアップしてビルドし、生成された .jar を .cmd で実行しようとすると

次のエラーが表示されます。

これまでのところ、問題をコードの次の行に絞り込むことができます。

OCRに与えられた「ファイル」を確認しました。これは完全に無傷の .tif-image です (とにかく Netbeans 内でうまく動作するため)。私が考えたもう1つのことは、.jarがtesseractに必要な.dllを見つけられないという問題である可能性があります。そのため、必要な .dll を「dist」フォルダーにコピーしました。どちらも成功しませんでした。プロジェクトのライブラリに tess4j-1.3.0.jar をインバウンドしました。

NetBeans 内ですべてが完全に正常に動作するのは非常に奇妙です。ライブラリへのリンクを見逃していると思いますが、何も考えられません。

あなたに提供するために私が考えることができるのはそれだけです。前もって感謝します!

0 投票する
1 に答える
1943 参照

java - IntelliJ で Tess4j を使用するにはどうすればよいですか?

JavaでOCRを行いたいのですが、IntelliJを使用しています。しかし、プロジェクトに必要なファイルが何であるかわかりません。

私のコードは単純な OCR です。

0 投票する
1 に答える
4210 参照

java - java.lang.NoClassDefFoundError: net/sourceforge/tess4j/TesseractException

Java と Tesseract を使用して Mirth の ocr アプリケーションを実行しようとしています。プロジェクトを jar ファイルにエクスポートし、Hello World アプリケーションを実行した Javascript を使用して Mirth を呼び出します。jar ファイルを正しい方法で追加したと思いますが、問題があります。 Java OCRで、このエラーが発生します。

エラー (com.mirth.connect.connectors.js.JavaScriptDispatcher:193): JavaScript ライター (チャネル b469e5af-a78d-41ca-86a0-a7b507799a4d の JavaScript ライター "RTF>DCM") の評価中にエラーが発生しました。java.lang.NoClassDefFoundError: net/sourceforge/tess4j/TesseractException

プロジェクトのスクリーンショット

お世話になり、誠にありがとうございました。

0 投票する
2 に答える
1641 参照

java - java.lang.IllegalAccessError: メソッド net.sourceforge.tess4j.Tesseract にアクセスしようとしました。()クラス Tess4jTest.TestTess の V

Mirth から jar ファイルを実行すると、このエラーが発生します。検索すると、init() メソッドがあり、Tesseract.java で保護された void であることがわかりましたJava OCR。多分それがそのエラーの理由だと思います。どうすればいいですか?ご協力ありがとうございます。TesseractMirth