Delphi/Sql Server で記述されたクライアント サーバー DMS を維持しています。
ユーザーがデータベースに保存されているすべてのドキュメント内の文字列を検索できるようにしたいと思います。(ファイルは blob として保存され、スペースを節約するために zip ファイルとして保存されます)。
私の考えは、「チェックイン」でそれらをインデックス化することです。そのため、nwe ファイルを保存すると、その中のすべてのテキスト情報が抽出され、新しい DB フィールドに配置されます。したがって、どういうわけか私のファイルテーブルは次のようになります。
ID_FILE integer
ZIPPED_FILE blob
TEXT_CONTENT text field (nvarchar in sql server)
pdf、txt、rtf、doc、docx、pdfなど、少なくとも最も一般的なテキストのようなファイルの「インデックス作成」をサポートしたいと思います.xlsおよびxlsx、ppt、pptxを追加する場合があります。
MS Office ファイルの場合、アプリケーションで既に ActiveX を使用しているため、txt ファイルの場合は単にファイルを読み取ることができますが、pdf と odt の場合は ActiveX を使用できますか?
すべてのファイルタイプを「恐れずに」解析する最高のテクニック、またはサードパーティのコンポーネント(無料でもありません)を提案できますか?
ありがとう