1

Windows 7 64ビットでtesseract 3.0.1を使用しています。

トレーニングに関するドキュメントには次のように書かれています。

各フォントは単一のマルチページ tiff に配置する必要があります ( libtiff を使用している場合のみ! )

私はlibtiffに精通していません。ImageMagick を使用して複数ページの tiff を作成します。これまでのところ、これはうまく機能しているか、少なくとも機能しているようです。後で障害が発生する可能性はありますか? その場合、libtiff をどうするか - セットアップを実行するだけで十分ですか、それとも何か設定する必要がありますか?

4

1 に答える 1

1

Tesseract は、leptonica (内部的には libtiff に依存) で読み取ることができる限り、複数ページの tiff をどのように作成したかは気にしません。tesseract が現在 tiff を処理できる場合は、トレーニング プロセスの残りの部分と OCR を実行するために同じことを行うことができるので、準備完了です。.Net 標準ライブラリを使用して複数ページの tiff を作成しましたが、tesseract には問題はありませんでした。

于 2012-05-28T07:54:10.153 に答える