新しいフォント用に Tesseract OCR エンジンをトレーニングするために、これらの手順に従っています。
しかし、ボックスファイルを作ろうとするとエラーが出てしまいます。これは私が使用するコマンドです:
H:\Documents\TesseractTraining>tesseract eng.helvetica.exp0.tif eng.helvetica.exp0 batch.nochop makebox
そして、ここにエラーメッセージがあります:
Tesseract Open Source OCR Engine v3.02 with Leptonica
TIFFstream: Sorry, can not handle image.
Unsupported image type.
一部のグーグルは、Leptonica のインストールにエラーがある可能性があることを示唆しています。Leptonica が自分のコンピューターにインストールされているかどうかさえわかりません。Web ページはいくつかの README (「README」と呼ばれるものと「ドキュメント」と呼ばれるもの)でかなり混乱しています。 Windowsで動作します。Visual Studio 2008 の Express Edition を使用しているため、提案されたコマンド プロンプトを使用できません。
だから、私の質問は次のとおりです。誰かが何が間違っているのか、どうすれば修正できるのか知っていますか?