私は最近、Java と JSoup (http://jsoup.org/) HTML パーサーを使用してカスタム Web クローラー/スパイダーを作成しました。Web クローラーは非常に初歩的なものです。Jsoup のconnectメソッドとgetメソッドを使用してページのソースを取得し、次に他の JSoup メソッドを使用してコンテンツを解析します。見つけたほぼすべてのリンクをランダムにたどりますが、ファイルのダウンロードやスクリプトの実行を試みることはありません。
クローラーは、基本的にランダムな Web ページの長いリストからシード ページを選択します。その中には、アダルト コンテンツや悪意のあるコードが含まれている可能性があるものもあります。最近、クローラーを実行しているときに、ウイルス対策 (Avast) がリクエストの 1 つに「脅威が検出されました」というフラグを立てました。問題のある URL は悪意があるように見えました。
私の質問は、私のコンピューターが Web クローラーを介してウイルスやマルウェアに感染することはありますか? 実施すべき予防策やチェックはありますか?