-2

Web サイトのリストからドメインとパスを抽出したいと考えています。たとえば、Web サイトがhttp://www.domain.com/path1/page1.htmlの場合、http: //www.domain.com/path1/を取得し、Web サイトがhttp://www. domain2.com/path2/page2/ http://www.domain2.com/path2/を取得したいと思います。

ページをダウンロードしてすべてのアンカーを取得しようとしましたが、ファイルの相対パス (この場合は /page1.html と /page2/) しか取得できませんでした。私が望むものを達成する方法はありますか?

4

1 に答える 1

0

path2 は、すべての URL に常に存在するものではありません。そのため、それを解析するための既製のメソッドは取得できません。アイデアを得るために、そのための関数を非常に大まかに書くことをお勧めします。

var index = url.IndexOf(".com/");
var substringAfterFirstSlash = url.SubString(index, url.Length + 1 - index)
var indexOfSecondSlash = substringAfterFirstSlash.IndexOf("/") + index;
var yourPath = url.SubString(0, indexOfSecondSlash+1 );
于 2012-07-16T20:28:22.883 に答える