0

urlparse.urljoin に関するいくつかの状況を修正したいと考えています。このライブラリを次のように使用する

urljoin('http://xxxx.yyy/directory/','file.file')

http://xxxx.yyy/directory/file.fileを提供しますが、最終的に次のようなURLにスラッシュを付けない場合

urljoin('http://xxxx.yyy/directory','file.file')

http://xxxx.yyy/file.fileが表示され、自動収集プログラムを作成するのが難しくなります。誰でもこの問題を解決する解決策を見つけることができますか? 最後に正規表現と置換でスラッシュを入れようとしましたが、URLが次のように終了すると、これらは正しく機能しません

http://xxxx.yyy/zzzz/file.file
4

1 に答える 1

0

正しく動作しています。にアクセスしているときにhttp://example.com/index.htmlへのリンクをクリックすると、 に移動します。これが、相対 URL が機能するように定義されている方法です。two.htmlhttp://example.com/two.html

urljoin最後のコンポーネントがディレクトリかどうかを知る方法はありません。おそらく を探して推測し、.そこにあると思われる場合にのみスラッシュを追加することができます。

于 2014-02-10T06:10:56.840 に答える