正しい質問をしているかどうかはわかりませんが、非常に行き詰まっています。最終年度のプロジェクト用に独自の検索エンジンを作成したいと考えています。また、約 1 か月間、Web エンジンに関する調査を行いました。私はnutch、lucene、solr、xapian、yaCyに出くわしました。しかし、これでは十分ではありませんでした。また、パーサー、インデクサー、クローラー、およびページ ランク アルゴリズムが必要になることもわかっていますが、開始する必要があるものが多すぎて、どこから開始すればよいかわかりません。
必要なのは、これらの用語 (インデクサー、クローラーなど) と、これらの apache プロジェクトを段階的に実装する方法、およびどの apache プロジェクトを使用する必要があるかについて見つけることができるチュートリアルまたは本だけです。