これが実際に Web クローラーと呼ばれているかどうかはわかりませんが、これが私がやろうとしていることです。
C# .Net を使用して Visual Studio 2010 でプログラムを作成しています。
最初の部分が同じすべての URL を検索したい。
ホームページwww.mywebsite.com
があり、いくつかのサブページがあるとします: /tab1
、/tab2
、/tab3
など。
で始まるすべての URL のリストを取得する方法はありwww.mywebsite.com
ますか?
したがって、 を指定するwww.mywebsite.com
と、プログラムはwww.mywebsite.com/tab1
、www.mywebsite.com/tab2
、www.mywebsite.com/tab3
などを返します。
ps。サブページの合計数がわかりません。
-- 12:04pmに編集 --
説明不足でごめんなさい。
上記のタスクを実行する C# でクローラーを作成する方法を知りたいです。
私が知っているのはメインの url だけwww.mywebsite.com
で、目標はそのすべてのサブページを見つけることです。
-- 12:16pmに編集 --
また、メイン ページにはリンクがなく、html は基本的に空白です。
サブページが存在することは知っていますが、正確な URL を提供する以外にリンクする方法がありません。