Webスクレイピングをしようとしていますが、相対URLとルートURLの結合に問題があります
たとえば、ルート URL は次のとおりです。http://www.jmlr.org/proceedings/papers/v2
相対 URL は次のとおりです。../v2/meila07a/meila07a.pdf
urlparse で urljoin を使用すると、結果が奇妙になります:
http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf
これは有効なリンクではありません。誰でもそれを手伝ってもらえますか?