正しい技術の方向性を教えていただければ幸いです。私は、c# 開発と SQL データベースの優れたスキルを持つ小さなソフトウェア開発チームの一員です。
私たちは、ドキュメント ストレージ アプリケーションを作成する任務を負っています。このアプリケーションは、スキャンした文書を PDF 形式で受け取ります。ドキュメントを保存し、オペレータが保存されたドキュメントを検索できるようにする必要があります。この検索には、PDF 内のテキストを検索する機能を含める必要があります。
たとえば、動物に関する多くの PDF を含むデータベースがある場合、オペレータは「horse」というキーワードで検索し、「horse」という単語に言及しているすべてのドキュメントのリストを取得する必要があります。
Lucene.Net などの NoSQL データベースとライブラリについて読んでいます。しかし、今では多くの時間を費やしましたが、どのテクノロジーを使用すべきかはまだ明確ではありません。誰かが似たような経験をしたり、私が向かうべき方向を知っていますか?