-1

私は最近、Java と JSoup (http://jsoup.org/) HTML パーサーを使用してカスタム Web クローラー/スパイダーを作成しました。Web クローラーは非常に初歩的なものです。Jsoup のconnectメソッドとgetメソッドを使用してページのソースを取得し、次に他の JSoup メソッドを使用してコンテンツを解析します。見つけたほぼすべてのリンクをランダムにたどりますが、ファイルのダウンロードやスクリプトの実行を試みることはありません。

クローラーは、基本的にランダムな Web ページの長いリストからシード ページを選択します。その中には、アダルト コンテンツや悪意のあるコードが含まれている可能性があるものもあります。最近、クローラーを実行しているときに、ウイルス対策 (Avast) がリクエストの 1 つに「脅威が検出されました」というフラグを立てました。問題のある URL は悪意があるように見えました。

私の質問は、私のコンピューターが Web クローラーを介してウイルスやマルウェアに感染することはありますか? 実施すべき予防策やチェックはありますか?

4

1 に答える 1

4

理論的には、それは可能です。

ただし、Flash や同様のプラグインを実行せず、テキスト データのみを処理するため、HTML パーサーに既知の脆弱性がない可能性が非常に高くなります。

さらに、ウイルスや悪意のある Web サイトはすべて、大規模なユーザー グループをターゲットにしています。JSoup を使用しているユーザーはごくわずかです。たとえば、ほとんどが Internet Exploder を使用しています。ウイルスがこれらのプラットフォームを標的にするのはそのためです。最近、Mac OSX はますます魅力的になっています。Mac OSX ユーザーが Web サイトにアクセスすると、古い Java セキュリティの問題を介してのみ感染する新しいマルウェアについて読みました。ダライ・ラマ関連のサイトで見つけたので、もしかしたら中国語かもしれません。

あなたが本当に偏執的である場合は、システムに「nobody」ユーザーを設定してください。これは厳しく制限されています。これは、Linux で最適に機能します。特に SELinux を使用すると、Web クローラーのアクセス許可を、外部 Web サイトをロードして結果をデータベースに送信する以外のアクセスを停止できるところまで絞り込むことができます。その後、攻撃者はクローラーをクラッシュさせるか、DDoS 攻撃のために悪用することしかできませんが、システムを破壊したり乗っ取ったりすることはできません。

于 2012-12-08T09:39:27.450 に答える