Python urlparseを使用して、URLからサブドメインなしでドメイン名を抽出する方法が必要です。
たとえば、のよう"google.com"
な完全なURLから抽出したいと思い"http://www.google.com"
ます。
私が持っていると思われる最も近いものurlparse
はnetloc
属性ですが、これにはサブドメインが含まれています。この例では、これはですwww.google.com
。
www.google.comをgoogle.comに変換するカスタム文字列操作を作成できることは知っていますが、このタスクでは手動による文字列変換や正規表現を避けたいと思います。(この理由は、カスタム解析関数を作成する際に必要なすべてのエッジケースを検討できると確信できるほど、URL形成ルールに精通していないためです。)
または、urlparse
私が必要なことを実行できない場合、誰かが他のPython URL解析ライブラリを知っていますか?