3

正八胞体トレーニングについて質問があります。私は現在、Javaプログラム内にTesseractを統合するためにTess4Jを使用しています。tesseractトレーニングに関するtesseractwikiページ(http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3)を読むと、さまざまな組み合わせとフォントのトレーニング画像を使用してtesseractをトレーニングできます。

これらのlang.traineddataファイルを構築する「通常の」tesseract3.02(windowsまたはunix)をインストールし、その後、これをJavaプログラムのTess4Jラッパーが使用するtessdataフォルダーに含めることは可能ですか。または、Tess4Jは、含まれている英語の言語データ、およびプログラムにバンドルされているサンプル画像に制限されていますか?

もしそうなら、他の方法でこれらを私のTess4Jビルドに含めることは可能ですか?

4

1 に答える 1

3

これは Tesseract OCR エンジンの単なるラッパーであるため、標準の問題またはカスタムのトレーニング済みデータ ファイルを受け入れます。標準のトレーニング済みデータはhttps://github.com/tesseract-ocr/tessdataにあります。

于 2012-09-08T21:33:04.473 に答える