10

スキャンされたテキストではなく、スクリーン キャプチャされた画像内のテキストを識別するように設計された OCR エンジンはありますか? アプリケーションでテキストを取得して識別する必要があるプロジェクトがありますが、これまでに試した OCR エンジンのどれも、スクリーンショットにうまく対応できませんでした。

理想的には、エンジンは色と背景ノイズでうまく機能する必要がありますが、そのようなものが利用できない場合は、ある程度の余裕を持たせることができます.

.NET 互換である必要があります。.NET で記述されているか、.NET 呼び出し可能な API を備えています。

4

4 に答える 4

5

Tesseract OCRは、オープン ソース プロジェクトとしてはかなり堅実であることがわかりました。Megaupload のような単純なキャプチャも読み取ってデコードできることがわかりました。これはちょっと工夫すればかなりうまくいくと思います。

唯一の問題は、圧縮されていない TIFF 画像しか受け付けないことです。これは煩わしい場合があります。

編集: Philip Daubmeier は既に .NET 統合を発見しましたが、以下はビットマップを非圧縮 TIFF に変換するコードです。

private void ConvertBitmapToTIF(Bitmap convert)
{
    ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
    System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
    System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;

    EncoderParameters parms = new EncoderParameters(2);
    EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
    EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
    parms.Param[0] = param0;
    parms.Param[1] = param1;

    convert.Save("output.tif", codecInfo, parms);
}

これはファイルに保存されますが、Bitmap.Saveメソッドはストリームにも書き込むことができます。

于 2010-08-27T02:58:46.917 に答える
4

通常、OCR テクノロジはスキャンされたテキストで動作するように調整されていますが、これは少なくとも 200 dpi ですが、信頼できる OCR 品質のためには 300 dpi をお勧めします。したがって、通常は 96 dpi に近いと考えられる画面テキストで機能するように、設定の微調整とあらゆることに力を注ぐ必要があります。

ABBYY はスクリーン ショット OCR ソフトウェアを持っています: http://www.abbyy.com/screenshot_reader/は、その技術がこの条件でうまく機能することを証明しています。私はそれを使用します、それはちょうど動作します。したがって、OCR SDK については ABBYY にお問い合わせください: http://www.abbyy.com/ocr_sdk/ (.NET から使用可能)

安くはありませんが、機能します。免責事項: 私は ABBYY で働いています

于 2010-08-05T11:20:46.037 に答える
1

基本的に、さまざまな研究者が試して成功したCAPTCHA 回避ツールを探しています。

もう 1 つの方法は、スムージング アルゴリズムを使用して 96 DPI のキャプチャを補間し、それらを 300 DPI に変換してから (たとえば、Photoshop を使用)、標準の OCR ツールを使用することです。

于 2010-08-29T04:46:38.173 に答える
0

最初の回答 (OCR ソフトウェア) を使用します。画面キャプチャの場合は、おそらく PRNTSCRN (printscreen) 文字を送信してから、クリップボード (bmp) の内容を tiff に変換できます。

これがあなたのベンチャーにもう少し役立つことを願っています

于 2010-08-31T09:33:04.937 に答える