正则获取网址，不知道 11 行处的代码改变后为什么没用了

Question

正则获取网址，不知道 11 行处的代码改变后为什么没用了

大白杏仁

24

发布于
2017-11-16

更新于
2017-11-18

新手上路，请多包涵

1.问题：
第一条正则表达式获取 163/qq/gmail 格式邮箱，最后只得到 '163', 'qq', 'gmail'
第二条正则却能得到正确邮箱，不是很理解，希望有前辈告知原因

2.代码

代码1：

  1 import re
  2 
  3 urls = """
  4 http://www.ireaqwe.com/messfo.asp?id=35
  5 http://3995503.com/cld/cla09/news_sw.asp?id=14
  6 http://lib.wdf.edu.cn/news/onews.asp?id=769
  7 http://www.zsy-lass.com/alfx.asp?newsid=377&id=6
  8 http://www.fsaacm.com/newslasisad.asp?id=415
  9 """
 10 
 11 res = re.findall(r'http://.*\.(com|cn)/', urls)
 12 print(res)

结果：`['com', 'com', 'cn', 'com', 'com']`

代码2(改变 11 行语句)：

11 res = re.findall(r'http://.*\.com/|http://.*\.cn/', urls)

结果

['http://www.interoem.com/', 'http://3995503.com/', 'http://lib.wzmc.edu.cn', 'http://www.zy-ls.com/', 'http://www.fincm.com/']

正则表达式

python

阅读 2k

1 个回答

得票最新

勤奋的懒人

727139

发布于
2017-11-16

✓ 已被采纳

在正则表达式中使用“()”会让括号中的内容变成一个“组”，要达到你的要求，应改成(?:com|cn)

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

正则获取网址，不知道 11 行处的代码改变后为什么没用了

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

这段代码为什么不能获取到数据？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？