import re
regex = re.compile("##[\s,\w]\w+[\r,\n,\r\n,\w]$")
str1 = r"#标题\r\n## 标题一号\n##标题二号\r## 标题三号\r\n##标题四号"
print(re.findall(str1))
尝试这么写,想要的规则是:
以"##"开头,后面跟一个空格或字母/汉字,再跟上若干个任意字符(空格也行),最后以r或n或rn回车换行符结束
最后要求返回值是一个列表,每一项代表一个二级标题
import re
regex = re.compile("##[\s,\w]\w+[\r,\n,\r\n,\w]$")
str1 = r"#标题\r\n## 标题一号\n##标题二号\r## 标题三号\r\n##标题四号"
print(re.findall(str1))
尝试这么写,想要的规则是:
以"##"开头,后面跟一个空格或字母/汉字,再跟上若干个任意字符(空格也行),最后以r或n或rn回车换行符结束
最后要求返回值是一个列表,每一项代表一个二级标题
import re
str='''
#标题
## 标题一号
##标题二号
## 标题三号
##标题四号
'''
result=re.findall(r'^##\s*([^#\n]+)',str,re.M)
print(result)
2 回答5k 阅读✓ 已解决
2 回答1k 阅读✓ 已解决
4 回答881 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
1 回答1.6k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
为什么要用正则表达式匹配,直接读整个文件,然后把以
##
开头的行取出来然后去掉##
不就行了吗。