PHPと正規表現を使用して小さなスクリプトをプログラミングしています
このスクリプトの目的は、ページ内のすべてのリンクを抽出し、これらのリンクを絶対リンクに変換することです.
このページに次のリンクがある場合、このページhttp://www.example.com/xxx1/xxx2/xxx3.htmlがあるとしましょう
index.html --- 絶対リンクはhttp://www.example.com/xxx1/xxx2/index.htmlになります
./index.html --- 絶対リンクはhttp://www.example.com/xxx1/xxx2/index.htmlになります
../index.html --- 絶対リンクはhttp://www.example.com/xxx1/index.htmlになります
/index.html --- 絶対リンクはhttp://www.example.com/index.htmlになります
それで
index.html = 現在のディレクトリで開きます
./index.html = 現在のディレクトリでも開きます
../index.html = 親ディレクトリで開きます
/index.html = ルート ディレクトリで開きます
問題は、URL が検索エンジンに適したものである場合はどうなるかということです。
この URL があるとします。
((ケース1)): http://www.example.com/xxx1/xxx2/xxx3/index/
また
((case2)): http://www.example.com/xxx1/xxx2/xxx3/index
case1 の "index" はディレクトリですか、それともページですか? case2 の場合はディレクトリですか、それともページですか? そして、次のリンクがケース 1 と 2 の両方で絶対リンクとしてどのように見えるか
index.html --- ?
./index.html --- ?
../index.html --- ?
/index.html --- ?
一部の人にとっては簡単な質問かどうかはわかりませんが、私にとっては混乱しますか?
ありがとう :)