In [78]: s
Out[78]: ' <meta http-equiv="Content-Type" content="text/html; charset=gbk"'
In [79]: b = re.compile("<meta.*content=.*charset=(?P<charset>[^;\s]+)", flags=re.I)
In [80]: b.search(s).group(1)
Out[80]: 'gbk"'
In [78]: s
Out[78]: ' <meta http-equiv="Content-Type" content="text/html; charset=gbk"'
In [79]: b = re.compile("<meta.*content=.*charset=(?P<charset>[^;\s]+)", flags=re.I)
In [80]: b.search(s).group(1)
Out[80]: 'gbk"'
4 回答4.5k 阅读✓ 已解决
1 回答3.4k 阅读✓ 已解决
4 回答3.9k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
2 回答465 阅读✓ 已解决
1 回答4k 阅读✓ 已解决
[]
:字符集合。匹配所包含的任意一个字符。[^]
:负值字符集合。匹配未包含的任意字符。例如,'[^abc]'
可以匹配"plain"
中的'p'
、'l'
、'i'
、'n'
。;
:就匹配分号\s
:匹配任何空白字符,包括空格、制表符、换页符等等整体
[^;\s]
匹配非;
与非空白字符
的其他任何字符推荐两个正则学习网站
Regulex
RegExr