1

Dosadi の PB 10.5.2 と EZTwain 3.30.0.28、XDefs 1.36b1 をスキャンに使用しています。

また、OCR管理にTOCR 3.0を使用しています。

関数では、他のすべての中で次のものを使用します。

...

Long ll_acquire

(as_path_filename is a function argument)

...

...

TWAIN_SetAutoOCR(1)

ll_acquire = TWAIN_AcquireMultipageFile(0, as_path_filename) 

問題は、スキャンした PDF ページにラテン語 (英語) とギリシャ語が含まれていることです。英語の文字はかなり正確に検索されますが、ギリシャ語はまったく検索されません。

これはTOCRソフトウェアと関係があると思いますか. ギリシャ語のANDを検索したいだけです

前もって感謝します

4

2 に答える 2

1

OCRソフトウェアは、ギリシャ語の単語をOCRされたテキストに変換できない場所にあるはずです。実際のOCRエンジンにTOCRを使用しているOCR部分にEZTwainを使用しているようです。そのソフトウェアのドキュメントを見て、多言語で使用するために変更できる設定について言及されているかどうかを確認することをお勧めします。

于 2010-04-22T20:30:23.833 に答える
1

Web サイトによると、TOCR は英語、フランス語、イタリア語、ドイツ語、オランダ語、スウェーデン語、フィンランド語、ノルウェー語、デンマーク語、スペイン語、ポルトガル語を認識します。ギリシャ語と英語の混合テキストを処理できるソフトウェアが必要です。ABBYY FineReader Professional には、英語とギリシャ語のサポートがリストされており、その他にも多数のサポートがあります。

于 2010-04-26T15:41:50.537 に答える