Python 根据URL提取网站根域名方法

我写的这段代码有很多情况都未考虑到,希望各位提出比较全面的方法:

import re

reg = r'^https?:\/\/([a-z0-9\-\.]+)[\/\?]?'
url = 'http://segmentfault.com/blog/biu/1190000000330941'
m = re.match(reg, url)
uri = m.groups()[0] if m else ''
print uri[uri.rfind('.', 0, uri.rfind('.')) + 1:]

# 输出结果:segmentfault.com
阅读 16.1k
1 个回答
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题