24

スクリーンショットからすべての文字を認識するために何をお勧めしますか? スクリーンショットは完全にクリア (白い背景に黒いテキストのみ) で、テキストには標準フォント (Windows にインストール済み) を選択できます。私はいくつかの OCR の方法 (Tesseract など) を試しましたが、一部の文字の認識に誤りがありました (テキストにノイズがほとんどなく、フォントが最も一般的なものであったため、困惑しました。Courier New、Fixedsys など)。 100% 正確である必要があります。この特定の目的、パターン認識などに使用できるライブラリはありますか? または、等幅フォントでスクリーンショットを取得する必要があります。右の +font_size ピクセルに移動する画像を反復処理し、キャプチャしたものを同じサイズの同じフォントの文字と数字のメモリ内表現と比較しますか? この問題に対する最善のアプローチは何でしょうか? 事前にどうもありがとうございました。

更新: スクリーンショットを作成している正確なサイズの等幅フォント (Courier New) を使用して Tesseract をトレーニングすることにより、最終的に 100% の精度を得ることができました。将来誰かを助けることを願っています:)

4

5 に答える 5

1

OCR がこのような高品質の入力に対してこれほど悪い結果をもたらすとしたら、私は驚かれることでしょう。おそらく、あなたがやりたいことは、エッジがシャープで、アンチエイリアスがなく、フォントサイズが大きいフォントを選択することです。

また、許容できる場合は、この SO の質問にある OCR フォントを試してください。

これにより、可能な限り最高の結果が得られるはずです。これが 100% にならない場合は、どうなるかわかりません...

Tesseract 以外で何を試したかはわかりませんが、そうでない場合は、他のものを試す価値があるかもしれません。これらは最近更新されたようです (Tesseract は 1 年前に更新されました)。

次のようなオンライン版もあります。

サンプル文書のテストに使用できます。このリンクから:

欲しいものを手に入れるには、商業化する必要があるようです。

お役に立てれば。

于 2010-11-17T21:47:45.060 に答える
1

既に問題が解決されていることは承知していますが、これが他の人の助けになる場合に備えて: スクリーンショットを処理するときに私が見つけた 2 つの問題は、OCR エンジンが次の点に敏感であることです: (1) 画像ファイルのヘッダーに誤って設定された解像度、および (2) 透過性問題 (白い背景のように見えるものは、実際には透明とマークされています)。何らかの理由で、これらの問題はスクリーンショット画像で頻繁に発生する傾向があります。

また、Tesseract 以外に、ABBYY OCR エンジンに基づくAPI ( http://www.wisetrend.com/wisetrend_ocr_cloud.shtml ) を試すこともできます。(利点は、インストール/構成/etc を試して、イメージで動作することを確認する必要がないことです。HTTP POST を作成するだけです)。免責事項: WiseTrend は私の会社の顧客です。

于 2010-12-01T01:08:22.597 に答える
0

OS レベルでテキストのアンチエイリアスを変更するオプションはありますか? これらの設定をいじってみる (またはオフにしようとしている) と、既存の OCR でもより良い結果が得られる可能性があります。

于 2010-11-17T21:27:41.140 に答える