正则表达式问题

想用正则提取如下信息 改怎么写呢?

123 男 北京          张三
343 女 河北 石家庄   李四
2343 男 山东         王五



提取 男 张三
     女 李四
     男 王五
回复
阅读 2.8k
1 个回答

其实对于中文, 特别是这样格式的中文, 我是不建议用正则的, 虽然勉强也能实现:

# coding: utf8
import re
filename = '2.txt'
patern = re.compile(r'^\d+ (\S+).*?(\S+)')
with open(filename) as f:
    for i in f:
        result = patern.findall(i[:-1])
    
        if result and len(result[0]) == 2:
            print result[0][0], result[0][1]
            
# 输出:
男 北京
女 河北
男 山东

你也可以用split的方法(建议):

# coding: utf8
filename = '2.txt'
with open(filename) as f:
    for i in f:
        result = i.split()
        print result[1], result[-1]
    
# 输出:
男 北京
女 河北
男 山东
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏