如何在python中用正则表达式匹配md文件中所有的二级标题

import re

regex = re.compile("##[\s,\w]\w+[\r,\n,\r\n,\w]$")

str1 = r"#标题\r\n## 标题一号\n##标题二号\r## 标题三号\r\n##标题四号"

print(re.findall(str1))

尝试这么写，想要的规则是：
以"##"开头，后面跟一个空格或字母/汉字，再跟上若干个任意字符（空格也行），最后以r或n或rn回车换行符结束
最后要求返回值是一个列表，每一项代表一个二级标题

阅读 4.3k

2 个回答

得票最新

✓ 已被采纳

为什么要用正则表达式匹配，直接读整个文件，然后把以##开头的行取出来然后去掉##不就行了吗。

import re
str='''
#标题
## 标题一号
##标题二号
## 标题三号
##标题四号
'''
result=re.findall(r'^##\s*([^#\n]+)',str,re.M)
print(result)

撰写回答

推荐问题

相似问题

找不到问题？创建新问题