彼ら
クローラーに訪問済みリンクを追加する次のコードがあります。リンクを抽出した後、個々のhref タグをループするfor ループがあります。
そして、リンクにアクセスして開いた後、上で定義した訪問済みリンク コレクション変数に URL を追加します。
private final Collection<String> urlForntier = Collections.synchronizedSet(new HashSet<String>());
クローラーの実装はマルチスレッドであり、100,000 の URL にアクセスした場合、クローラーを終了しなければ、日々成長すると想定しています。メモリの問題が発生しますか?スレッド間で矛盾を生じさせずに変数を更新するには、どのオプションが必要ですか?
前もって感謝します!