いくつかの内部サーバーのすべてのWebページにインデックスを付けることができるエンタープライズ(イントラネット)検索エンジンを展開または開発し、Googleがイントラネットに対して行っていることと同様に、関連するすべてのコンテンツを表示する検索ポータルを用意するように求められます。
迅速に開発または展開する方法についてアドバイスはありますか?Microsoft FAST製品について聞いたことがありますが、それがこの目的のためであるかどうかわかりませんか?
よろしくお願いします、ジョージ
いくつかの内部サーバーのすべてのWebページにインデックスを付けることができるエンタープライズ(イントラネット)検索エンジンを展開または開発し、Googleがイントラネットに対して行っていることと同様に、関連するすべてのコンテンツを表示する検索ポータルを用意するように求められます。
迅速に開発または展開する方法についてアドバイスはありますか?Microsoft FAST製品について聞いたことがありますが、それがこの目的のためであるかどうかわかりませんか?
よろしくお願いします、ジョージ
必要な磨きのレベルにもよりますが、Nutch プロジェクトはほぼターンキー ソリューションです。http://lucene.apache.org/nutch/
Google 検索アプライアンスは、ぜひチェックしてみたいハードウェア ソリューションです。
ソフトウェア ベースのアプローチとして、Lucene検索エンジンが考えられます。
無料の Microsoft ソリューションはMicrosoft Search Server Expressです。SharePoint での検索と同様に機能します。
ジョージ、
急いでいるようですね。
再作業、再作業、再作業に期待を設定し始める方がよいでしょう。
私はあなたが今時間を過ごすことを強くお勧めします
おそらく基本、中、青空として要件を確立します
どの検索エンジン、フロントエンド、クローラーなど(オープンソースまたはベンダー提供)が実際に要件を満たすことができるかを判断します
これらのツールで利用可能なサポート、およびタイムリーで実行可能な回答または回避策を取得する可能性を判断します(少なくともオープンソースにはこのサポート契約はありません)
一度に全部やろうとしないでください。スポンサーの管理がどれだけ進んでいるかに関係なく、最初に最小のデータセットを実行します。システムまたは計画に致命的な大規模な欠陥を発見するためだけにテストを行うのに何ヶ月も費やすことはありません。
チェックポイントを使用して、さまざまなレベルまたは要件へのロードマップを作成することにより、チームおよびスポンサーと連絡を取ります。
中小規模の企業検索プロジェクトの事前計画については、MartinWhiteの「MakingSearchWork」を強くお勧めします。
ランキングと関連性は、優れた検索ソリューションを提供するための最も重要な部分の1つであることがわかると思います。エンジンはおそらく同様の機能を提供しますが、それを行う方法の詳細は異なります。さらに重要なことに、関連性を強制することで得られる成功は、選択した検索エンジンの機能の一部にすぎません。言い換えると、テキストが検索エンジンアルゴリズムと調和していない場合、さまざまなチューニングパラメータとその組み合わせ論を理解するために多くの時間を費やすことになります。(私は今のところ2にしか精通していないので、他の人はこれと矛盾することを歓迎します)。
それは素晴らしい学習体験です。幸運を。
FAST は優れたエンタープライズ検索製品です。コンサルティング会社の評価では常にトップにランクされています。ただし、ある程度の技術的なセットアップとサポートが必要です。
Google も堅実な製品ですが、非常に高価です。必要な技術サポートは少なくなりますが、検索結果の制御も少なくなります.