これが実際に Web クローラーと呼ばれているかどうかはわかりませんが、これが私がやろうとしていることです。
C# .Net を使用して Visual Studio 2010 でプログラムを作成しています。
最初の部分が同じすべての URL を検索したい。
ホームページwww.mywebsite.comがあり、いくつかのサブページがあるとします: /tab1、/tab2、/tab3など。
で始まるすべての URL のリストを取得する方法はありwww.mywebsite.comますか?
したがって、 を指定するwww.mywebsite.comと、プログラムはwww.mywebsite.com/tab1、www.mywebsite.com/tab2、www.mywebsite.com/tab3などを返します。
ps。サブページの合計数がわかりません。
-- 12:04pmに編集 --
説明不足でごめんなさい。
上記のタスクを実行する C# でクローラーを作成する方法を知りたいです。
私が知っているのはメインの url だけwww.mywebsite.comで、目標はそのすべてのサブページを見つけることです。
-- 12:16pmに編集 --
また、メイン ページにはリンクがなく、html は基本的に空白です。
サブページが存在することは知っていますが、正確な URL を提供する以外にリンクする方法がありません。