コマンドラインまたは API を使用して、Tesseract-OCR で認識された文字のフォントを取得することは可能ですか。つまり、Arial または Times New Roman です。
さまざまなフォントのさまざまな部分が含まれている可能性のあるドキュメントをスキャンしていますが、この情報があると便利です。
コマンドラインまたは API を使用して、Tesseract-OCR で認識された文字のフォントを取得することは可能ですか。つまり、Arial または Times New Roman です。
さまざまなフォントのさまざまな部分が含まれている可能性のあるドキュメントをスキャンしていますが、この情報があると便利です。
Tesseract には、使用できるクラスでWordFontAttributes
定義された API 関数があります。ResultIterator