大規模な Web クローラーで URL キューを構築するにはどちらが適していますか。リンクリストまたはBツリー?
3 に答える
2
キューを検索する必要がない場合 (通常、キューを検索する必要がない場合) は、リンクされたリストです。
于 2009-06-02T02:46:44.490 に答える
1
順序が重要である場合(そしてキューが重要である場合)、リンクリスト。キューを検索する必要がある場合は、Bツリーを検索します。
于 2009-06-02T03:00:11.777 に答える
1
大規模なクローラーを構築している場合は、ほぼ確実にAMQPメッセージキューのようなもの、おそらくRabbitMQを使用したいと思うでしょう。RabbitMQ(および他の多くの同様のMQ)は、かなり通常のインストールで1秒あたり100,000以上のトランザクションを実行します。私はそれを自分のスパイダー/クローラーのセットアップで使用し、それは魅力のように機能します。確かに、似たようなものを最初から作成するよりもはるかに簡単です。
于 2009-07-15T18:44:25.257 に答える