去除特殊字符 只保留中文、英文、数字

import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)

结果:
123我123456abcdefgABCVDFF
函数说明
sub(pattern,repl,string)把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**]表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5汉字的unicode范围
\u0030-\u0039数字的unicode范围
\u0041-\u005a大写字母unicode范围
\u0061-\u007a小写字母unicode范围
\uAC00-\uD7AF韩文的unicode范围
\u3040-\u31FF日文的unicode范围

瑞0908
318 声望75 粉丝

一个一个解决