1

私はまだ解決策を見つけていません。私がやろうとしているのは、独自の金融ソフトウェア プラットフォームから特定の数値テキスト値を読み取ることです。私は最初にアクセシビリティと要素スパイの方法を試しましたが、失敗しました。私が考えることができる他の唯一の方法は、特定の固定領域で画面の OCR を使用することです。

私がチェックアウトしたすべての OCR ソリューションは、ファイル ベース (PDF、TIFF など) のようです。私が本当に必要としているのは、画面からキャプチャできる OCR ソリューションです。私が考えることができるいくつかの課題: キャプチャするテキストは黒の背景にあり、色付きのテキスト (黄色、緑、赤、オレンジ) である可能性があります。テキストサイズもかなり小さいです(6ptだと思います)。

理想的には .NET API が欲しいのですが、機能するものは何でも試してみたいと思っています。

4

2 に答える 2

2

これは OCR の質問に答えないかもしれませんが、試すことができる最後の方法は、windows の DrawText API をフックすることです。私は最近、あなたが自分自身を抱えていたような同様の問題を解決するためにこれについて学びました。

EasyHookライブラリをダウンロードして、例を見てください。外部アプリでDrawTextA 、 DrawTextWDrawTextExA 、および DrawTextExWをフックしてみてください(外部プログラムではなく Inproc DLL をフックしていたため、質問のコードとは異なるコードになりますが、ユースケースは EasyHook が設計されたものです。私のやり方はハックでした)。それが何を使用しているかを調べ、コードを取得してテキストを解析できるかどうかを確認してください。

于 2012-10-01T15:10:32.867 に答える
1

このOCRSDKをお試しください

スクリーンショットを作成し、地域を指定してOCRに渡します。そのようなアプローチで良い結果が得られました。tesseractも試しましたが、スクリーンフォントで正しく動作させることができませんでした。

于 2012-10-19T18:50:05.167 に答える