新手上路，请多包涵

我有这一行删除除空格外的所有非字母数字字符

re.sub(r'\W+', '', s)

虽然，它仍然保留非英文字符。

例如，如果我有

re.sub(r'\W+', '', 'This is a sentence, and here are non-english 托利 苏 !!11')

我想获得输出：

 > 'This is a sentence and here are non-english  11'

原文由 Filipe Aleixo 发布，翻译遵循 CC BY-SA 4.0 许可协议

python 正则表达式

阅读 1.8k

2 个回答

得票最新

社区维基

发布于
2023-01-08

✓ 已被采纳

re.sub(r'[^A-Za-z0-9 ]+', '', s)

（编辑）澄清： [] 创建一个字符列表。 ^ 否定列表。 A-Za-z 是英文字母和 “ 是空间。对于其中的任何一个或多个（即不是 AZ、az 或空格的任何内容）替换为空字符串。

原文由 Nir Levy 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2023-01-08

这可能不是这个具体问题的答案，但我在研究过程中遇到了这个话题。

我想达到与提问者相同的目标，但我想包括非英语字符，例如：ä,ü,ß, …

提问者代码的工作方式，空格也将被删除。

一个简单的解决方法如下：

 re.sub(r'[^ \w+]', '', string)

^ 表示除了以下内容之外的所有内容都被选中。在这种情况下 \w，因此每个单词字符（包括非英语）和空格。

我希望这会在将来帮助某人

原文由 Tilman Böckenförde 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

如何只保留字母数字和空格，同时忽略非 ASCII？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

如何只保留字母数字和空格，同时忽略非 ASCII？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？