新手上路，请多包涵

我有一组输入。我正在尝试编写一个正则表达式来匹配输入中的以下模式：

现场时间 _

输入示例：

今天 中午 12:30 在 Sam 的客厅

文本的粗体部分在每个输入中都不同。

我写了以下正则表达式：

 import regex as re

input_example = "Today at 12:30 PM on Rakesh's Echo"
regexp_1 = re.compile(r'(\w+) at (\d+):(\d+) (\w+) on (\w+)')
re_match = regexp_1.match(input_example)

哪个有效，我正在匹配正确的模式。我现在正试图从模式中提取组。

我想要的输出是：

 re_match.group(1)
>> "Today"
re_match.group(2)
>> "12:30 PM"
re_match.group(3)
>> "Sam's living room"

但是，我当前的正则表达式匹配没有给我这个输出。给我上述输出的正确正则表达式是什么？

原文由 Rakesh Adhikesavan 发布，翻译遵循 CC BY-SA 4.0 许可协议

python 正则表达式

阅读 544

2 个回答

得票最新

社区维基

发布于
2023-01-10

✓ 已被采纳

你很接近。你只是想稍微调整你的捕获组看起来像……

re.compile(r"(\w+) at (\d+:\d+ \w+) on (.+)")

请注意，第二个捕获组现在将匹配完整的 hour:minute period-of-day 。 The final capture group (\w+) will match a-z , A-Z , 0-9 and _ , but not ' 导致您只能捕获一小部分描述。更改为 .+ 允许它匹配任何字符。如果您只知道 \w 之外的几个字符需要匹配，您可以执行 [\w']+ 以及您需要的任何其他字符。

使用和测试正则表达式的好工具是 https://regex101.com/ 只需确保选择 python 语言即可。

原文由 rsiemens 发布，翻译遵循 CC BY-SA 3.0 许可协议

社区维基

发布于
2023-01-10

您可以创建嵌套组，但那样可读性不佳，因为您必须计算组的确切数量，然后您会忘记该数字的确切含义。

最好使用命名组。这是从 REPL 复制的：

 >>> import re
...
... input_example = "Today at 12:30 PM on Rakesh's Echo"
... regexp_1 = re.compile(r'(?P<day>\w+) at (?P<time>(\d+):(\d+) (\w+)) on (?P<place>\w+)')
... re_match = regexp_1.match(input_example)
>>> list(re_match.groups())
['Today', '12:30 PM', '12', '30', 'PM', 'Rakesh']
>>> re_match.group('day')
'Today'
>>> re_match.group('time')
'12:30 PM'
>>> re_match.group('place')
'Rakesh'

原文由 Mariy 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

在正则表达式匹配中提取组

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译