1

私は新しい会社にいますが、私たちの目標の 1 つは、チームとクライアントのためにドキュメント検索ポータルを実装することです。Salesforce やクラウド内の他の ECM などの外部サービス プロバイダーを使用すると、将来的に多くの統合作業が発生するのではないかと少し心配しています。クライアントの観点から見ると、これらのドキュメントは、構造化されたコンテンツ (MS Word ドキュメントではなく、DB に保存されます) と同じバケットにも存在します。

ドキュメント検索を実装している場合、どの言語、フレームワーク、テクノロジーを使用しましたか? 失敗談はありますか?すぐに使用できるものを使用するのに問題はありませんが、ドキュメントとドキュメントにアクセスするための API を制御できることが重要だと思います。フルカスタムするならRailsを使いたいです。

4

2 に答える 2

2

ライセンスの必要性に応じて、Lucene (LGPL) とXapian (GPL) はどちらも優れた成熟した高速検索エンジン API であり、多くの言語に対応しています。私はそれらの両方を使用して大成功を収めました。

于 2010-05-04T14:02:05.720 に答える
1

Luceneは広く使用されており、非常に優れているため、おそらく最も安全な選択です。

Lucene を利用する最も簡単な方法は、おそらくインストールが簡単なAlfrescoを使用することであり、デフォルトで Lucene が含まれています。つまり、Alfresco をインストールし、ドキュメントをリポジトリに配置するだけで、強力な Web 検索インターフェイスを使用してドキュメントを検索できます。

プログラムで検索する必要がある場合は、REST 方式で検索できる Alfresco のCMISインターフェイスを使用することをお勧めします。JCR API も利用できます。

于 2010-06-11T03:18:28.723 に答える