0

画像でドキュメント OCR を使用しています。ページに「コーヒー」や「432」などの単語がある場合は正常に機能しますが、「abc123」などの単語を OCR しようとすると、「OCR 実行エラー」が発生します。 .

MODI.Document md = new MODI.Document();

md.Create("c:\\temp\\mpk.tiff");

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);  // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0]; 

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);

StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();

md.Close();

確かに、MS は言語ベースの単語のみを認識するためにこのライブラリを構築していませんか? それとも彼らはしましたか?MODI.document 設定か何かがありませんか?

どんな助けでも大歓迎です、

4

1 に答える 1

2

はい、彼らがしました。OCR は、関連する辞書とコンテキストを提供しないフラグメントがないと、本当に不正確になります。人間もそうです:ABC123、ABCI23、ABCl23。3 つの異なる文字列。これは、銀行の小切手に見られるような、文字と数字があいまいになる可能性を最小限に抑える特殊なフォントを使用することで実際に解決されます。

于 2011-03-05T22:06:24.040 に答える