-1

可能であれば、プロジェクト、オープンソースのrssクローラー、およびJavaのフィードリーダー(または2つの異なるツール)で使用する必要があります。私は多くの異なるツールを見てきましたが、どれが最高か知っていますか。

よろしくお願いします

4

1 に答える 1

2

完全な検索エンジンが必要な場合は、ApacheNutchをご覧ください。

Webクロールの原則を理解したいだけの場合は、「集合知プログラミング」の非常に簡単な紹介と「情報検索の概要」のより高度な紹介を読んでください。

RSSとAtomフィードの解析が必要な場合は、Romeを使用してください。

また、 Web-Harvestなどのスクレイパーも確認してください。

于 2012-09-13T13:35:04.143 に答える