我有一个非常大的图像文件夹,以及一个包含每个图像类标签的 CSV 文件。因为它们都在一个巨大的文件夹中,所以我想将它们分成训练/测试/验证集;也许创建三个新文件夹并根据某种 Python 脚本将图像移动到每个文件夹中。我想进行分层抽样,这样我就可以在所有三组中保持相同的类别百分比。
制作可以执行此操作的脚本的方法是什么?
原文由 Yuerno 发布,翻译遵循 CC BY-SA 4.0 许可协议
我有一个非常大的图像文件夹,以及一个包含每个图像类标签的 CSV 文件。因为它们都在一个巨大的文件夹中,所以我想将它们分成训练/测试/验证集;也许创建三个新文件夹并根据某种 Python 脚本将图像移动到每个文件夹中。我想进行分层抽样,这样我就可以在所有三组中保持相同的类别百分比。
制作可以执行此操作的脚本的方法是什么?
原文由 Yuerno 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.2k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.5k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
2 回答899 阅读✓ 已解决
1 回答1.8k 阅读✓ 已解决
使用 python 库拆分文件夹。
让所有图像存储在
Data
文件夹中。然后申请如下:在运行上面的代码片段时,它将在
output
目录中创建 3 个文件夹:可以使用
ratio
参数(train:val:test)
中的值来改变每个文件夹中的图像数量。