私は、他の検索エンジンが現在行っているように Web アイテムのインデックスを作成し、ファイルのタイトル、URL、およびコンテンツのハッシュのみを保存する検索エンジンのアイデアを思いつきました。
このようにすれば、すでにアイテムを持っていて、それらがどこから来たのかわからない場合や、何かが出現したすべての場所を知りたい場合に、Web 上でアイテムを簡単に見つけることができます。
画像、実行可能ファイル、アーカイブなどの非テキスト アイテムにはより便利です。
すでに似たようなものがあるのだろうかと思っていましたか?