大量の相対 URL を使用するサイトをスクレイピングしようとしています。1 つのアーカイブ ページには多数の個別エントリへのリンクがありますが、URL は「../2011/category/example.html」のように指定されます。
エントリごとに、ページを開いてスクレイピングしたいのですが、それを処理する最も効率的な方法がわかりません。開始 URL を「/」で分割し、最後の項目をポップオフして再度結合し、ベース URL を取得することを考えています。
しかし、それはそのような塊のように思えます。よりクリーンな方法はありますか?