1

大量のスキャンと OCR ソリューションが必要です

1日に約4000件のドキュメントをデジタル化し、それらをocr(隠しテキスト付き)でpdfファイルとして保存することについて話しています...

このソリューションでは、オペレーターがドキュメントをスキャンし、ファイルを特定のネットワーク リソースに自動的に保存して、それを DB にアップロードするアプリで取得できるようにする必要があります...

Kofax http://www.kofax.com/のエンタープライズ ソリューションを評価しています。

他に知っている製品は何ですか?

同様の要件の経験はありますか?

オープンソース (または少なくともアクセス可能な) ソリューションはありますか?

com、activex api のサポート?

4

5 に答える 5

5

スキャン、インデックス作成、OCR オーバーレイを使用した PDF の生成 (個人的には、PDF の OCR アンダーレイを好む) など、必要なことを実行できるスキャン製品のベンダーは多数あります。これらの要件は、スキャンを専門とするベンダーにとっては非常に些細なことです。Kofax 以外のベンダー/製品をいくつか挙げると、次のようになります。

  • EMC/Captiva の InputAccel 製品
  • データ容量
  • eCopy ShareScan
  • Verity/Cardiff/Autonomy

多くのドキュメント管理ソリューションにはスキャン フロント エンドも組み込まれていますが、通常、特殊なキャプチャ製品ほど機能的ではありません。これらのソリューションのほぼすべてが、COM/ActiveX API をサポートしています。スキャン用のオープン ソース ソリューションについては知りませんが、実際に検索したことはありません。

ほとんどのスキャン ソフトウェア ベンダーは、「ボリューム」ライセンスまたは「キャパシティ」ライセンスを使用しています。通常、ボリュームは期間の終わりに更新されます (つまり、年間 100 万ページ - 追加料金なしで毎年自動更新されます)。したがって、年間 100 万画像の容量を購入し、最終的に 50 万ページしかスキャンしない場合、払い戻しを受けられないという意味で、厳密に「ページごと」に支払う必要はありません。自動更新されない 1 回限りのボリュームを持つことはあまり一般的ではありませんが、それがなくなると、追加のボリュームを購入する必要がある可能性があります。ほとんどのベンダーは、ボリュームを制御するためにドングルから離れ、ソフトウェア ライセンスに移行しています。

Kofax に関する補足:

Kofax はこれまで付加価値再販業者のシステムを通じて販売されてきたため、さまざまな実装の品質は大きく異なる可能性があります。さらに、高度なカスタマイズが可能で、多数のアドオン モジュールを備えたさまざまなフレーバーが用意されているため、1 つの顧客の Kofax システムが他のシステムと大きく異なる場合があります。

Kofax は、エンタープライズ レベルのシステムで、年間何百万ものドキュメントのスキャンと自動キャプチャに使用されています。これは、ドキュメント スキャンの市場シェアのかなりの部分を占めています。いいえ、私は Kofax ファンボーイではありません。もしそうなら、競合製品について言及しなかったでしょう。しかし、私はそれをよく知っています。市場に出回っている他の製品と同様に、長所と短所があります。マイケルは自分が聞いたことをただ伝えていたことに気づきましたが、コメントなしでその広範な一般化を通過させることはできませんでした. 市場シェアのかなりの割合を占めている製品がスキャンに対して「役に立たない、またはユーザー フレンドリーではない」と言うのは、「Windows は有用なサーバー オペレーティング システムではない」と言っているようなものです。それは一般化の範囲が広すぎます。

乾杯、

ブライアン

于 2009-07-18T01:19:00.303 に答える
0

PSIGENは、Kofaxの優れた代替品であり、機能が満載で、手頃な価格です。

Kofaxの代替スキャンおよびキャプチャアプリケーション

于 2009-09-10T22:18:41.990 に答える
0

OCR をどの程度改善したいですか? すべてのコンテンツを人間が読めるようにする必要がありますか、それともドキュメントを分類できるようにするために一部のコンテンツのみが必要ですか (顧客番号、ドキュメントの種類、バーコードなど)。

http://www.irislink.comは、ドキュメントのスキャンと分類のソリューションを開発する会社です。
同社のソフトウェアは、いくつかのブランドの多機能および消費者向けスキャナーに含まれています。企業は、情報を抽出して使用することをより目的としています(会計ソフトウェアへの請求書の自動入力など)。
私の経験では、OCR されたテキストを Kofax (両方を使用) よりも適切に処理します (単語の修正など)。ただし、Kofax は、より良いレベルに到達するようにさらに拡張できます (これは、より多くのセットアップ作業とより多くのメンテナンスを意味します)。

どちらのソフトウェアも、ドキュメントの処理方法に関して非常に便利です。
ドキュメントをスキャンすることだけが必要な場合。PDF に変換し、ネットワーク共有に保存します。優れたスキャナーを購入し、付属のソフトウェアを使用するだけで十分かもしれません。
tesseract プロジェクトもチェックしてみてください。これはオープン ソースの ocr エンジンであり、優れた結果が得られています。

于 2012-03-25T13:02:10.423 に答える
0

ChronoScan を試すことができます。tesseract による無料の OCR があり、フォーム認識オプションがあり、非商用の場合は無料です。

ソフトウェアは高度な開発段階にあり、開発者と直接話すフォーラムがあります。

http://www.chronoscan.org 短いビデオ リーディング フォーム

于 2012-12-11T12:30:06.053 に答える