重複の可能性:
PythonのURLからサイト名を取得する
このようなURLの場合:
http://twitter.com/pypi
http://www.wolframalpha.com/input/?i=python
'http://twitter.com'または'http://wolframalpha.com'部品を引き出したいのですが。
次のコードは機能しますが、よりクリーンな方法の提案を探しています...
'/'.join(url.split('/',3)[:3])
重複の可能性:
PythonのURLからサイト名を取得する
このようなURLの場合:
http://twitter.com/pypi
http://www.wolframalpha.com/input/?i=python
'http://twitter.com'または'http://wolframalpha.com'部品を引き出したいのですが。
次のコードは機能しますが、よりクリーンな方法の提案を探しています...
'/'.join(url.split('/',3)[:3])
( Python 3より前のurllib.parse名前の)モジュールを使用できます。urlparse
>>> from urllib.parse import urlparse
>>> urlparse("http://twitter.com")
ParseResult(scheme='http', netloc='twitter.com', path='', params='', query='', fragment='')
>>> r = urlparse("http://twitter.com")
>>> r.scheme + '://' + r.netloc
'http://twitter.com'
別の(読みにくい)メソッドurlparse:
>>> from urlparse import urlparse, urlunparse
>>> urlunparse(urlparse("http://twitter.com/pypi")[:2] + ("",) * 4)
'http://twitter.com'