1

重複の可能性:
PythonのURLからサイト名を取得する

このようなURLの場合:

http://twitter.com/pypi
http://www.wolframalpha.com/input/?i=python

'http://twitter.com'または'http://wolframalpha.com'部品を引き出したいのですが。

次のコードは機能しますが、よりクリーンな方法の提案を探しています...

'/'.join(url.split('/',3)[:3])
4

2 に答える 2

3

( Python 3より前のurllib.parse名前の)モジュールを使用できます。urlparse

>>> from urllib.parse import urlparse
>>> urlparse("http://twitter.com")
ParseResult(scheme='http', netloc='twitter.com', path='', params='', query='', fragment='')
>>> r = urlparse("http://twitter.com")
>>> r.scheme + '://' + r.netloc
'http://twitter.com'
于 2012-09-05T16:15:40.623 に答える
0

別の(読みにくい)メソッドurlparse

>>> from urlparse import urlparse, urlunparse
>>> urlunparse(urlparse("http://twitter.com/pypi")[:2] + ("",) * 4)
'http://twitter.com'
于 2012-09-05T16:22:00.573 に答える