私はJavaでWebクローラーを開発しています。私はそれに基づいてこのクローラーを開発するための良いプロジェクトを探しています。ただし、Javaで記述されたクローラーは文字通り数百を超えています。私が探しているのは、次のような非常にシンプルなクローラーです。
- マルチスレッド機能
- 良好なパフォーマンス
- 最新のJavaビルドと新しいテクノロジーに基づいて実装されています
- 良いドキュメント
- 不必要な機能(膨張)はそれほど多くありません
- プロジェクトに簡単に統合できる機能
私はJavaでWebクローラーを開発しています。私はそれに基づいてこのクローラーを開発するための良いプロジェクトを探しています。ただし、Javaで記述されたクローラーは文字通り数百を超えています。私が探しているのは、次のような非常にシンプルなクローラーです。
私が探しているのは、かなりシンプルなクローラーです...
あなたは本当にそれを見つけるつもりはありません、クローラーについて簡単なことは何もありません!ケースとポイント、これらの機能(特に最後の箇条書き)を持つことについて簡単なことは何もありません:
Nutchは、ほとんどの要件を満たすフル機能のJavaクローラーです:http://nutch.apache.org/
さらに、この質問を確認することをお勧めします:https ://stackoverflow.com/questions/2495289/what-is-a-good-java-web-crawler-library