python如何处理中英文混排的最长公共前缀?

比如:
str1 = "我是a good boy" str2 = "我是a bad boy"

两者的公共前缀为:我是a
阅读 5.1k
5 个回答

其实我想说,如果楼主强调的是“中英文混排”这件事的话,那么如果两个字符串的同为unicode,或者采用了相同的字节编码方式的话,应该中英文混排这件事其实是没有区别的。

采用unicode时,每个汉字或者每个英文都是一个完整的字符;采用比如utf-8编码时,每个汉字是3个字节,每个英文是一个字节,那么依然不影响前缀的比较

新手上路,请多包涵

转化為list

os.path.commonprefix((str1, str2))

def longestprefix(str1, str2):
    if str1 == str2:
        return str1
    return '' if str1[0] != str2[0] else str1[0] + longestprefix(str1[1:], str2[1:])

Python 3.4 测试可以, 2.x 没尝试

引自 os.path.commonprefix,参数可以是任意数量的list

def commonprefix(m):
    if not m: return ''
    s1 = min(m)
    s2 = max(m)
    for i, c in enumerate(s1):
        if c != s2[i]:
            return s1[:i]
    return s1

commonprefix(['我是a good boy', '我是a bad boy'])

如果只需要两个字符串,可以简化为

def commonprefix(s1, s2):
    for i, c in enumerate(s1):
        if c != s2[i]:
            return s1[:i]
    return s1
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题