可能であれば、プロジェクト、オープンソースのrssクローラー、およびJavaのフィードリーダー(または2つの異なるツール)で使用する必要があります。私は多くの異なるツールを見てきましたが、どれが最高か知っていますか。
よろしくお願いします
可能であれば、プロジェクト、オープンソースのrssクローラー、およびJavaのフィードリーダー(または2つの異なるツール)で使用する必要があります。私は多くの異なるツールを見てきましたが、どれが最高か知っていますか。
よろしくお願いします
完全な検索エンジンが必要な場合は、ApacheNutchをご覧ください。
Webクロールの原則を理解したいだけの場合は、「集合知プログラミング」の非常に簡単な紹介と「情報検索の概要」のより高度な紹介を読んでください。
RSSとAtomフィードの解析が必要な場合は、Romeを使用してください。
また、 Web-Harvestなどのスクレイパーも確認してください。