Tesseract OCR で使用される構成ファイルが受け入れるパラメーター、構成ファイルの作成方法などを知りたいです。
彼らのサイトでこれに関するドキュメントを見つけることができません。サポートされているパラメーターとその意味を確認するにはどうすればよいですか?
以下のリンクでこれらの手順を見つけました。彼らは設定ファイルを書くこととそれをどこに置くかについてです:
config ファイルは、BOM がなく、Unix の行末マークが付いた単純なテキスト ファイルです (Windows では、Notepad++ などの高度なテキスト エディタを使用してこれを実現できます)。
tesseract 実行可能ファイルを使用する場合、これが tesseract パラメータを変更する唯一の方法です。
config ファイルは、tessdata/configs ディレクトリに配置する必要があります。いくつかの例をご覧ください。
http://www.sk-spell.sk.cx/tesseract-ocr-parameters-in-302-versionには、すべての変数のリストと各変数の説明があります。これは Tesseract 3.02 用であることに注意してください。他のバージョンでは状況が異なる場合があります。
編集:上記のリンクが無効になった場合に備えて、ペーストビンのリンクも追加します。
Tesseract v3.04 はコマンド ライン オプション--print-parameters
を提供するようになったため、 を呼び出しtesseract --print-parameters
て、678 個 (!) の構成可能なパラメーター、そのデフォルト値、および簡単な説明のリストを取得できます。
Tesseract parameters:
editor_image_xpos 590 Editor image X Pos
editor_image_ypos 10 Editor image Y Pos
editor_image_menuheight 50 Add to image height for menu bar
editor_image_word_bb_color 7 Word bounding box colour
editor_image_blob_bb_color 4 Blob bounding box colour
editor_image_text_color 2 Correct text colour
...and many, many more
これは、Tesseract 構成変数用のスペースで区切られたキーと値のペアをそれぞれ別の行に含む単なるプレーン テキスト ファイルです。例えば:
interactive_display_mode T
tessedit_display_outwords T
Tesseractの tessdata/configsフォルダーの下には、数字、hocr などの標準的な構成ファイルがいくつかあります。