python正则表达式

刚学正则
很简单的获取jpg格式的图片
查看网页源码,jpg的URL就是
"thumbURL":"http://xxxxxxxxx.jpg",
"middleURL":"http://xxxxxxxx.jpg",
就是"XXXURL:"http://xxxx.jpg"
请问正则表达式怎么配?
我用这个r'".+?URL":"(.+?\.jpg)"'不行 // 没有控制URL前的字符数量
用这个r'"[a-z]+URL":"(.+?\.jpg)"'也不行 //这个URL前的字符只有一个,根本不能匹配

阅读 4.6k
2 个回答

用这个r'".+?URL":"(.+?\.jpg)"'发生如评论的结果是因为URL前的.+?没有限制匹配字符数量。
所以改用这个r'"[a-z]{5,8}URL":"(.+?\.jpg)"'将URL前的字符数量控制在5-8个字符,这样就能匹配出正确的了

可以啊,怎么不行?

>>> import re
>>> res = re.match(r'".+?URL":"(.+?\.jpg)"', '"thumbURL":"http://xxxxxxxxx.jpg"')
>>> res.groups()
('http://xxxxxxxxx.jpg',)
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进