正则表达式提取指定字符串

发布于
2015-10-14

更新于
2015-10-14

text = u'''$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,'''
#如何提取出$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$两端$包含的字符串，目标是提取出5组字符串
#用pattern = re.compile(r'\\frac{.*?}{(.*?)}', re.S)不能正确提取出想要的数据

python 正则表达式

阅读 7.1k

2 个回答

vimac

题主真是，问问题不一步问到位

答案如下：

#-*- coding: utf-8 -*-
import re

text = u'''$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,
$\frac{$\frac{1}{2}$}{$sqrt[]{2}$}$,'''

re_text = re.compile(ur'\$(.+)\$')
for i in re_text.finditer(text):
    #print(i.group(1))
    #本来到上面这行就可以结束了，然而上面的\f会被python转义，所以我们转回去
    print(i.group(1).replace("\f", "\\f"))

输出

\frac{$\frac{1}{2}$}{$sqrt[]{2}$}
\frac{$\frac{1}{2}$}{$sqrt[]{2}$}
\frac{$\frac{1}{2}$}{$sqrt[]{2}$}
\frac{$\frac{1}{2}$}{$sqrt[]{2}$}
\frac{$\frac{1}{2}$}{$sqrt[]{2}$}

swevilet

1211

发布于
2015-10-14

更新于
2015-10-14

这个看你具体业务了，如果按照你上面的text和原来的正则表达式的话，正则改成'\\frac{.*}'应该就能完成，如果是要捕捉两个$符号之间的 '\$(.*)\$'的子捕获应该就是结果.
你原来的表达式因为加了'?'，变成非贪婪，第一个'{.*?}'捕捉的是{$\frac{1}，第二个捕捉的是{2}，所以没有提取正确数据

问题似乎换成多行的了，不过一样，看你的正则配置'.'是匹配非换行符的，则不变，如果'.'是匹配包括换行符的，那就换成'\${\S*}\$'

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

正则表达式提取指定字符串

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？