0

ユーザーがファイル、主に PDF および Word ドキュメントをアップロードできるようにするアプリケーションがあります。これらのファイルは、データベースの varbinary フィールドに保存されます。ユーザーがどのようにアプリケーションにアクセスしているかに関係なく、Web または Windows フォーム アプリケーションまたはその他のプレゼンテーション レイヤーを介してこれらのファイルを利用できるようにする必要があります。

これらのフィールドの生のテキスト コンテンツを検索する方法はありますか? たとえば、履歴書をアップロードする場合、ユーザーが C# を検索して、指定したテキストの varbinary フィールドの内容を確認できるようにしたいと考えています。

また、これを処理するためのより良い戦略があれば、私はそれを受け入れます.

4

2 に答える 2

3

バイナリ ドキュメントに格納されたテキストをネイティブに解析できないため、SQL Server を使用することは (検索に関して) 不適切なツールであると言えます。

アップロードしたドキュメントを簡単に検索できるようにするLucene.NET (Lucene 検索エンジンの .NET ポート...元は Java で記述)などを検討することをお勧めします。

ドキュメント ストレージを SQL Server に保持しながら、Lucene.NET を使用してそこに格納されているドキュメントのインデックス作成と検索を行うことができるソリューションを設計できるはずです。

于 2010-02-23T14:41:25.183 に答える
2

タイプを抽出し、フォーマットの知識を得るには、いくつかのコードのレイヤーが必要です。SQLにとっては、それは単なる生データです

于 2010-02-23T14:42:47.243 に答える