4

ウィキペディアによると、「ラテン文字のタイプライターで書かれたテキストの正確な認識は、印刷された文書のスキャンなど、鮮明な画像が利用できるアプリケーションでは、主に解決された問題と見なされています。」ただし、引用はありません。

私の質問は:これは本当ですか?現在の最先端技術は非常に優れているので、英語のテキストを適切にスキャンするために、大きな改善を行う必要はありませんか?

または、この質問の主観的でない形式は次のとおりです。高品質のスキャンのために英語のテキストを認識する際に、最新のOCRシステムはどの程度正確ですか。

4

2 に答える 2

5

確かに解決した問題だと思います。C#C ++JavaなどのOCRテクノロジーに関する多数の記事をご覧ください。

もちろん、この記事では、スクリプトをタイプライターで明確にする必要があることを強調しています。これにより、認識は比較的簡単な作業になりますが、スキャンしたページ(ノイズ)または手書き(拡散)をOCRする必要がある場合は、正しく調整することが多いため、扱いが難しくなる可能性があります。

于 2009-10-20T10:02:37.953 に答える
3

十分に高品質の2Dビットマップを長方形に分割することと狭義に考えられます。各長方形には、行儀の良い、事前に指定されたフォントのセットの1つの識別されたラテン文字が含まれます(Omnifontを参照)。これは解決された問題です。

風変わりな未知のフォント、ノイズの多いスキャン、アジアの文字など、これらのパラメータを試してみると、やや不安定になったり、追加の入力が必要になります。多くのよく知られているOminfontシステムは、合字をうまく処理しません。

そして、OCRの主な問題は、出力の意味を理解することです。これが解決された問題である場合、Googleブックスは完璧な結果をもたらします。

于 2010-01-01T09:36:22.557 に答える