スクリーンショットをキャプチャしてPCを自動化し、OCR(光学式文字認識)をクリックする特定のボタンを探すソフトウェアを作成しようとしています(たとえば)。マウスとキーボードの制御部分はありましたが、スクリーンショットを処理するために OCR が必要でした。私が発見したのは、Tesseract OCR が画面上のテキストに対してうまく機能しないように見えるということです。テキストが小さすぎるか、K と X のように一部のテキストがつながっているように見えます。どうすればよいですか?
p/s: これは自動テスト プログラム用です。