Google でサンプル プロジェクトを見つけてダウンロードし、サンプル .net プロジェクトをコンパイルしました。
入力された tessdata フォルダーを見つけることができる場所はありますか、それともライブラリをトレーニングする必要がありますか? 私が評価しているように、事前に入力された英語用の tessdata フォルダーを見つけることができればよいと思います。
サンプル プロジェクトはサンプル jpeg ファイルを開きましたが、自動回転しませんでした。これは、tessdata フォルダーにファイルがないことが原因である可能性があると思います。これは正しい仮定ですか、それとも画像の読み込み時に自動回転を実行することになっているtesseract dllですか
グレースケール画像を開こうとしましたが、ピクセルがサポートされていないと表示されて失敗しました。そのような制限を記載したドキュメントは見つかりませんでした。誰でもこれを確認するのを手伝ってもらえますか?
基本的に、ファックス/スキャンなどで送信されたドキュメントの自動回転を検討しています。そのため、C# プロジェクトで使用できる別のオープン ソースの代替案があれば、そのアイデアも受け入れます。
更新 1: Google でこのダウン tesseractを取得しました
cmdプロンプトを起動し、tesseract.exeを次のように起動しました
>tesseract.exe myimage.tiff -l eng
次のエラーが発生しました
Tesseract Open Source OCR Engine v3.01 with Leptonica
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
Page 0
更新 2: エラーに関する問題を整理しましたが、自動回転は自動的に発生していないようです