Tesseract OCRは、オープン ソース プロジェクトとしてはかなり堅実であることがわかりました。Megaupload のような単純なキャプチャも読み取ってデコードできることがわかりました。これはちょっと工夫すればかなりうまくいくと思います。
唯一の問題は、圧縮されていない TIFF 画像しか受け付けないことです。これは煩わしい場合があります。
編集: Philip Daubmeier は既に .NET 統合を発見しましたが、以下はビットマップを非圧縮 TIFF に変換するコードです。
private void ConvertBitmapToTIF(Bitmap convert)
{
ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;
EncoderParameters parms = new EncoderParameters(2);
EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
parms.Param[0] = param0;
parms.Param[1] = param1;
convert.Save("output.tif", codecInfo, parms);
}
これはファイルに保存されますが、Bitmap.Saveメソッドはストリームにも書き込むことができます。