検索技術の重要な部分は何ですか?
- 分散ファイル システム
- クラウドコンピューティング
- ストレージシステム
- ランキングアルゴリズム
- 検索アルゴリズム
または、他の何か?
検索技術の重要な部分は何ですか?
または、他の何か?
//皮肉な答えを始める
RAM + CPU + 帯域幅 + 本当に素晴らしい検索エンジン ソフトウェア
//皮肉な回答を終了
真剣に、検索技術と同じくらい複雑なものは、すでに挙げたように、多数の問題に左右されます。それを単一の銀の弾丸に固定しようとすることは、実際には当てはまりません。
検索でまだ克服されていないより大きな問題は、オノトロジーだと思います。結果を理解し、人にやさしい方法で分類するのは非常に困難です。これを「セマンティック Web」と呼ぶ人もいます。この大量のデータとインデックスがありますが、それを分類または適切に理解する方法は非常に貧弱です。欠点は、検索 (アルゴリズム) が理解できる方法でアトミックに自己表現できないことにあります。
検索とランキングは、インデックス作成と同様に非常に重要です。入力したキーワード (ala google、yahoo など) に厳密に一致する結果を見つけるには、効率的なアルゴリズムが必要であり、それらの結果をランク付けする必要があります。
私は最終年度のプロジェクトの一環として小さな検索エンジンを作成しましたが、逆索引は検索エンジンの重要な部分であると言えます。
クローラーも重要なパーツと言えます。
ページランクのアルゴリズムも重要だと言えます。
クラスタリングが重要であると主張することができます。
....
正確には何を探していますか?あなたの質問は私には広いようです。
索引付け?
検索エンジンでのパフォーマンスは重要です。遅いサービスは死んでいますが、それは最も重要な側面ではありません。そのバッジは、結果の関連性につながると思います。
私たちは検索エンジンに不可能なことを要求します。フレーズまたはいくつかのキーワードを取得し、どういうわけか、私たちが望んでいたものに正確に関連する結果を大量に返す. 私たちは何を探していたのか正確にはわからないかもしれませんが、それを見るとすぐにそれを認識することができます. 同様に、検索エンジンが「間違ったもの」を返しているときはすぐにわかります。
最終的には、私たちが言うことではなく、私たちが意味することを愚かなマシンに実行させることがすべてであり、これは基本的にコンピューティングでは解決できない問題です. 最高品質の検索ソリューションは常に、結果をランク付けして元のクエリに関連付ける最も斬新な方法を備えたものになります。ウェイン・ハートマンが彼の答えで説明しているように、この概念はオントロジーの概念と非常に密接に結びついています。