0

霊的組織からの特定の文学/引用/その他のセットのオンライン検索を作成しようとしていますが、検索できるアイテム (主に PDF、HTML、またはプレーン テキスト) の数は限られていますが、包括的な検索フィルターを提供します (Kayak.com スタイル)。

つまり、著者名、ソースの種類 (本、スピーチ、引用など)、いつ、どこで、およびその他のフィルターで簡単にフィルター処理できるように、データを整理する必要があります。つまり、各文献項目には、この「追加情報」が関連付けられている必要があります。

私の質問は、この検索エンジンを構築するにはどうすればよいですか? Lucerine のことは聞いたことがありますが、最近、検索用の .NET ライブラリである Searcharoo を発見しました。これは、ローカル ディレクトリにあるすべての PDF ファイルのインデックスを作成します。

私が疑問に思っているのは、Searcharoo を使用するべきか、それともファイルパスを格納する独自のデータベースを作成し、PDF ファイルのテキストを含む列をクエリするべきかということです。または、Searcharoo などを使用して、DB に保存されている追加情報で各インデックス ファイルにタグを付けることができますか? それとも、まったく別のアプローチをとるべきですか?

これに関するご意見をいただければ幸いです...

ありがとう!

4

2 に答える 2