6

私は、何百もの科学論文の PDF ファイルがディレクトリに保存されている博物館で働いています。Adobe Reader などのプログラムでキーワードを検索できるように、それらすべてに OCR を適用しました。このディレクトリで特定の種名を検索し、キーワードに一致するドキュメントのリストと対応するページ番号を生成できるプログラムを作成する必要があります。

私は、このタスクを達成できる (できれば) 無料の pdf ライブラリを探しています。PDFOne ライブラリを使用して小さなプログラムを作成しましたが、ディレクトリ全体で 1 つの用語を検索するのに約 10 分かかりました。Adobe Reader と PDF-XchangeViewer は同じ検索を 1 分以内で実行できるため、時間を大幅に短縮したいと考えています。使用する言語に好みはありません。

このタスクを達成できるように、適切なリソースを教えてくれる人はいますか? ありがとう。

4

1 に答える 1