私はゼロから検索エンジンを作っています (笑)、そして私はこの問題に固執しています:
ユーザーが URL を送信すると、私の「スパイダー」はそれを「クロール」して他のリンクを探します。もちろん、<a href="/page">
の代わりに使用する人も<a href="http://long-domain.com/page">
いるので、それを検出します
if(substr($link->getAttribute('href'), 0, 1) == '/')
そして、その前にドメインを追加します。しかし、ドメインを追加するたびに、一部のリンクが になりhttp://php.net//abcd
ます。ご覧のとおり//
。
今、私の考えは、送信された URL を編集するスクリプトを作成して、末尾にスラッシュがある場合は削除することでしたが、削除する方法がわかりません。