1

オープンソースの OCR を探していますが、どの文字を検索するかをプログラムに伝えることができるものです。たとえば、文字とコンマしか使用できない場合、OCR がそれが数字かどうかを判断するためにリソースを浪費することは望ましくありません。また、OCRが「考えている」ものの可能性を出力してほしいと思います。たとえば、「I」がある場合、OCR はそれを小文字の「L」と見なす可能性がありますが、近い秒として「I」も含まれている必要があります。基本的に、OCR に可能性のリストと、それがどれほど確実かを示す数字を提供してもらいたいと考えています。たとえば、「l」: 55%、「I」: 40%、その他: 5% と表示されます。

もう1つのことは、文字のテキストタイプ、つまりArielが何であるかがわかるため、OCRでさまざまなタイプのテキストを比較および対比することには意味がありません。

基本的に、私は特定の数の可能性しか存在しないプログラムを書いています。たとえば、OCR を使用して周期表から元素を読み取るとします。限られた数の要素しかないため、OCR は "HeIeun" が実際には "Helium" であると推測できるはずです。

このようなものはありますか、それとも自分でこれをコーディングするために大量の作業を行う必要がありますか? ありがとう。

4

1 に答える 1

0

Google によって開発されたオープン ソース プロジェクトtesseractを参照してください。非常に優れた結果が得られ、OCR が多数サポートされています。

テキストを認識するための独自の単語リストを提供するには、tessdata/eng.user-words を独自の単語リストに置き換えます。同じ形式 (UTF8 テキスト、1 行に 1 単語) にします。

非常に高い精度を得るには、この質問をチェックしてください。

于 2012-07-20T05:17:39.813 に答える