python使用re匹配字符串中重复出现的字母

huangzhuolin

195248

发布于
2015-09-15

（1）现在想要将字符串中连续出现的同个字母去重，如"abbbcccbba" -> "abcba"，使用re模块的话如何优雅的完成这件事情？

（2）完成需求(1)后，能否顺便统计连续出现的个数，如"abbbcccbba" -> "a1b3c3b2a1"?

python 正则表达式

阅读 16k

2 个回答

得票最新

begin

100916

发布于
2015-09-15

✓ 已被采纳

(1)

>>> import re
>>> p = re.compile(ur"([a-zA-Z])(\1+)")
>>> s = "abbbcccbba"
>>> p.sub(ur"\1",s)
'abcba'
>>>

(2)

>>> import re
>>> p = re.compile(ur"([a-zA-Z])(\1*)")
>>> s = "abbbcccbba"
>>> p.sub(lambda m: m.group(1)+str(1+len(m.group(2))), s)
'a1b3c3b2a1'

guyskk

1062

发布于
2015-09-15

更新于
2015-09-15

（1）

>>> import re
>>> p=re.compile(ur"(\w)(\1+)")
>>> s="abbbcccbba"
>>> p.sub(ur"\1",s)
'abcba'
>>>

（2）

import re


def count(s):
    p = re.compile(ur"(\w)(\1+)")
    keys = list(p.sub(ur"\1", s))
    words = list(s)
    result = []
    # print keys, words
    for k in keys:
        n = 0
        # print words
        while len(words) > n and k == words[n]:
            n = n + 1
        words = words[n:]
        result.append((k, n))
        # print result
    return result

if __name__ == '__main__':
    s = "abbbcccbba"
    result = count(s)
    print ''.join(["%s%s" % x for x in result])

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python使用re匹配字符串中重复出现的字母

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？