新手上路，请多包涵

我有一个要用作文件名的字符串，所以我想使用 Python 删除文件名中不允许的所有字符。

我宁愿严格一点，所以假设我只想保留字母、数字和一小组其他字符，如 "_-.() " 。什么是最优雅的解决方案？

文件名需要在多个操作系统（Windows、Linux 和 Mac OS）上有效 - 它是我库中的一个 MP3 文件，以歌曲标题作为文件名，并在 3 台机器之间共享和备份。

原文由 Sophie Gage 发布，翻译遵循 CC BY-SA 4.0 许可协议

python filenames slug sanitize

阅读 668

2 个回答

得票最新

社区维基

发布于
2022-12-29

✓ 已被采纳

您可以查看 Django 框架，了解它们如何从任意文本创建“slug”。 slug 是 URL 和文件名友好的。

Django 文本实用程序定义了一个函数 slugify() ，这可能是这类事情的黄金标准。本质上，他们的代码如下。

 import unicodedata
import re

def slugify(value, allow_unicode=False):
    """
    Taken from https://github.com/django/django/blob/master/django/utils/text.py
    Convert to ASCII if 'allow_unicode' is False. Convert spaces or repeated
    dashes to single dashes. Remove characters that aren't alphanumerics,
    underscores, or hyphens. Convert to lowercase. Also strip leading and
    trailing whitespace, dashes, and underscores.
    """
    value = str(value)
    if allow_unicode:
        value = unicodedata.normalize('NFKC', value)
    else:
        value = unicodedata.normalize('NFKD', value).encode('ascii', 'ignore').decode('ascii')
    value = re.sub(r'[^\w\s-]', '', value.lower())
    return re.sub(r'[-\s]+', '-', value).strip('-_')

和旧版本：

 def slugify(value):
    """
    Normalizes string, converts to lowercase, removes non-alpha characters,
    and converts spaces to hyphens.
    """
    import unicodedata
    value = unicodedata.normalize('NFKD', value).encode('ascii', 'ignore')
    value = unicode(re.sub('[^\w\s-]', '', value).strip().lower())
    value = unicode(re.sub('[-\s]+', '-', value))
    # ...
    return value

还有更多，但我把它漏掉了，因为它不解决 slugification，而是逃避。

原文由 S.Lott 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2022-12-29

您可以将列表理解与字符串方法一起使用。

 >>> s
'foo-bar#baz?qux@127/\\9]'
>>> "".join(x for x in s if x.isalnum())
'foobarbazqux1279'

原文由 lutz 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

将字符串转换为有效的文件名？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

将字符串转换为有效的文件名？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？