Web サイトの URL からディレクトリ階層を抽出したいと考えています。すべての Web サイトがディレクトリ構造に準拠しているわけではありません。(以下) を行う Web サイトについては、ディレクトリ階層を反映する Python 辞書 (以下) を作成できるようにしたいと考えています。URL から構造を辞書に抽出できる Python スクリプトを作成するにはどうすればよいですか?
Raw data:
http://www.ex.com
http://www.ex.com/product_cat_1/
http://www.ex.com/product_cat_1/item_1
http://www.ex.com/product_cat_1/item_2
http://www.ex.com/product_cat_2/
http://www.ex.com/product_cat_2/item_1
http://www.ex.com/product_cat_2/item_2
http://www.ex.com/terms_and_conditions/
http://www.ex.com/Media_Center
Example output:
{'url':'http://www.ex.com', 'sub_dir':[
{'url':'http://www.ex.com/product_cat_1/', 'sub_dir':[
{'url':'http://www.ex.com/product_cat_1/item_1'}, {'url':'http://www.ex.com/product_cat_1/item_2'}]},
{'url':'http://www.ex.com/product_cat_2/', 'sub_dir':[
{'url':'http://www.ex.com/product_cat_2/item_1'},
'url':'http://www.ex.com/product_cat_2/item_2']},
{'url':'http://www.ex.com/terms_and_conditions/'},
{'url':'http://www.ex.com/Media_Center'},
]}