-3

正しい質問をしているかどうかはわかりませんが、非常に行き詰まっています。最終年度のプロジェクト用に独自の検索エンジンを作成したいと考えています。また、約 1 か月間、Web エンジンに関する調査を行いました。私はnutch、lucene、solr、xapian、yaCyに出くわしました。しかし、これでは十分ではありませんでした。また、パーサー、インデクサー、クローラー、およびページ ランク アルゴリズムが必要になることもわかっていますが、開始する必要があるものが多すぎて、どこから開始すればよいかわかりません。

必要なのは、これらの用語 (インデクサー、クローラーなど) と、これらの apache プロジェクトを段階的に実装する方法、およびどの apache プロジェクトを使用する必要があるかについて見つけることができるチュートリアルまたは本だけです。

4

3 に答える 3

2

これを試してくださいhttp://blog.building-blocks.com/building-a-search-engine-with-nutch-and-solr-in-10-minutes

于 2012-04-16T11:14:57.120 に答える
0

検索エンジンが必要な場合は、多くの機能を備えた lucene ベースの検索エンジンであるOpenSearchServerを参照してください。ドキュメントを読んでください。

自分で書くつもりなら。あなたは車輪を再発明しようとしています 。情報検索入門の本を読んでみてください。.

于 2012-04-16T14:30:46.437 に答える
0

検索を実行するには solr のようなものが必要です。その後、メタ タイトルなどのさまざまなフィールドに重みを適用できます。部分的なドキュメントの追加と更新を確認する必要があります。

また、サイトをクロールしてインデックスを作成するための何かも必要になります。シバの投稿の例に従うことができます。

独自に作成する場合は、python を使用するか、サイトを curl できます。すべてのリンクを見つけ、さらにプロセスを開始して情報を収集します。

solr http://wiki.apache.org/solr/SolrInstallをインストールして schema.xml を作成し ます http://wiki.apache.org/solr/SchemaXml - どのフィールドが必要か、どのフィールドを検索可能にするかなどを考えます. その後、php に apache solr を使用したり、クエリに多くの代替手段を使用したりできます。

楽しい

于 2012-04-16T15:27:38.140 に答える