Web ページ上の単語の出現回数をカウントするスクリプトを作成する必要があります
私がやっていることは、ランダムなIPを計算し(同じIPを複数回チェックすることを避けます)、nmapを使用してポート80が開いているかどうかを確認し、それがWebサーバーであるかどうかを確認し、w3mを使用してhttpページをファイルとして作成します. 単語の出現回数を簡単に数えられるようになったら
いくつかの質問と問題がありました
- このプロセスには多くの時間がかかりますが、より速くする方法は考えられません
- ポート 80 が開いている IP の多くは Web サイトではありません。それらは稼働しておらず、問題がある可能性があります。稼働しているサイトのみを確認する方法はありますか?
- このメソッドは、Web サイトのインデックス ページに出現する単語のみをチェックします。他の公開ページもチェックする方法はありますか?
どうもありがとう