python中用正则表达式去掉字符串中的冒号

发布于
2017-03-05

更新于
2017-03-05

初学python，最近尝试爬数据，json字符串的value中有冒号，需要去掉。我的代码如下。
a和b都是value中会有冒号的字符串

import re
a = "Title:'Intern: Customer Experience + Innovation (CX+I) Intern Brands'"
b = "cmp:'Adecco: USA',cmpesc:'Adecco: USA'"
result = re.sub('^(?:Title|cmp|cmpesc):.+(\:)','', a)

代码执行结果是只剩 Customer Experience + Innovation (CX+I) Intern Brands'，之前的内容全被删除了，而我想要的效果是只删intern之后的那个冒号（title后的冒号要保留）。
请问大家该如何修改？

python 正则表达式 json

阅读 10.4k

4 个回答

得票最新

vancymoon

18617

发布于
2017-03-31

✓ 已被采纳

import re
result = re.sub('^(Title|cmp|cmpesc:)(.+):(.*)',
                '\\1\\2\\3',
                "Title:'Intern: Customer Experience + Innovation (CX+I) Intern Brands'")

print(result) # Title:'Intern Customer Experience + Innovation (CX+I) Intern Brands'

龙方淞

888211

发布于
2017-03-05

更新于
2017-03-06

这样的话：

''.join(re.split('(?<![Title|cmp|cmpesc]):',a))

就好了

sheep3

9971412

发布于
2017-03-31

更新于
2017-03-31

果然是我看错题目了....

同意并接受

7.2k21127

发布于
2017-03-31

更新于
2017-03-31

不用去掉冒号，直接变成字典就行了~

>>> a = "Title:'Intern: Customer Experience + Innovation (CX+I) Intern Brands'";\
b = "cmp:'Adecco: USA',cmpesc:'Adecco: USA'"
>>> dict([s.split(':',1) for s in a.split(',')])
{'Title': "'Intern: Customer Experience + Innovation (CX+I) Intern Brands'"}
>>> dict([s.split(':',1) for s in b.split(',')])
{'cmpesc': "'Adecco: USA'", 'cmp': "'Adecco: USA'"}
>>>

写成函数

a = "Title:'Intern: Customer Experience + Innovation (CX+I) Intern Brands'"
b = "cmp:'Adecco: USA',cmpesc:'Adecco: USA'"

def fn(x):
    return dict((s.split(':',1) for s in x.replace("'","").split(',')))

print(fn(a))
print(fn(b))

# {'Title': 'Intern: Customer Experience + Innovation (CX+I) Intern Brands'}
# {'cmp': 'Adecco: USA', 'cmpesc': 'Adecco: USA'}

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python中用正则表达式去掉字符串中的冒号

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

这段代码为什么不能获取到数据？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?