如何使用 glob() 递归查找文件?

新手上路,请多包涵

这就是我所拥有的:

 glob(os.path.join('src','*.c'))

但我想搜索 src 的子文件夹。这样的事情会起作用:

 glob(os.path.join('src','*.c'))
glob(os.path.join('src','*','*.c'))
glob(os.path.join('src','*','*','*.c'))
glob(os.path.join('src','*','*','*','*.c'))

但这显然是有限且笨重的。

原文由 Ben Gartner 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1k
2 个回答

路径库.路径.rglob

使用 Python 3.5 中引入的 pathlib.Path.rglob pathlib 模块中的 --- 。

 from pathlib import Path

for path in Path('src').rglob('*.c'):
    print(path.name)

如果你不想使用 pathlib,可以使用 glob.glob('**/*.c') ,但不要忘记传递 recursive 关键字参数,它会在大目录上使用过多的时间.

对于以点 ( . ) 开头的匹配文件的情况;例如当前目录中的文件或基于 Unix 的系统上的隐藏文件,请使用下面的 os.walk 解决方案。

os.walk

对于较旧的 Python 版本,使用 os.walk 递归遍历目录并使用 fnmatch.filter 匹配简单表达式:

 import fnmatch
import os

matches = []
for root, dirnames, filenames in os.walk('src'):
    for filename in fnmatch.filter(filenames, '*.c'):
        matches.append(os.path.join(root, filename))

原文由 Johan Dahlin 发布,翻译遵循 CC BY-SA 4.0 许可协议

对于 python >= 3.5 ,您可以使用 **recursive=True

 import glob
for f in glob.glob('/path/**/*.c', recursive=True):
    print(f)


If recursive is True (default is False ), the pattern ** will match any files and zero or more directories and subdirectories 。如果模式后跟 os.sep ,则只有目录和 subdirectories 匹配。


Python 3 演示

原文由 Pedro Lobito 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题