Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
ドメイン名を入力できるプログラムを知っている人はいますか?プログラムはドメイン全体をクロールし、すべての HTML ソース コードをダウンロードできるので、サイトのページにリンクがある場合はクロールのみを行います明らかに外部ドメイン名ではなく、ドメイン名のページに。
Pythonのスクレイピーを見てください:
http://www.scrapy.org
またはJavaの場合はcrawler4j:
http://code.google.com/p/crawler4j/