私はこれを理解するのに少し苦労しているので、あなたが助けることができればそれは素晴らしいことです。
サイトマップからURLのリストを取得するコードを少し書きました。次に、各ページに移動し、すべてのリンクをスクレイプして、ステータス(200,404など)をテストします。
HttpClientを使用しています。私はすべて問題なく動作していますが、Javaを初めて使用するので、コードは完全なハック/迷路であり、正しく編成されていれば、はるかに優れたパフォーマンスが得られる可能性が高いと思います。だから私が持っているのは
メインクラス-これはGUIを構築します
サイトマップクラスを解析します-これはサイトマップを解析し、URLのリストを取得します。
PingURlと呼ばれるクラス-上記は貧弱だと思いますが、これは私が最悪だと思うビットです。このクラスは、すべてのURLを開き、それらをスクレイプしてリンクを探し、リンクのステータスをテストして返します。このクラスは分解されるべきだと思いますか?最も重要なことは、リンクのテストを独自のクラスで分離する必要があると思うので、後でスレッドを実装するのは簡単ですか?
基本的に私はアドバイスを探しています。誰かがプロジェクトをもう少しうまくレイアウトするのを手伝ってくれるなら。第二に、これは私の最も弱い領域だと思うので、改善するにはこれについてもっと学ぶ必要があります。これを何と呼ぶかさえわかりません(設計/レイアウトの問題?)。これについてさらに学ぶためのリソースもお勧めできますか?