4

相対 URL から絶対 URL を作成するときに「無効な」親ディレクトリを説明する方法はあります.replace()か?

>>> from urlparse import urljoin
>>> url = urljoin('http://www.example.com/path/', '../../../index.html')
>>> url
'http://www.example.com/../../index.html'
>>> url.replace('../', '')
'http://www.example.com/index.html'

さらに良いことに、Python でスクレイピングするときに URL をサニタイズするよりクリーンな方法はありますか?

4

1 に答える 1

0

おっしゃる通り、意味不明です。ルート ディレクトリから上位に移動できます。したがって、作成者の意図を知らずに 2 番目の部分を正規化することは困難です。正しくサニタイズする方法を知っているのはあなただけです。:)

于 2013-03-30T03:12:50.183 に答える