我从 jpeg 格式的 PDF 文件中提取页面图像,我需要确定每个图像是更灰度、彩色还是黑白(具有容差系数)。
我找到了一些使用 PIL 进行颜色检测的方法( 此处 和 此处),但我不知道如何回答这个简单(视觉)问题:它是黑白图像、彩色图像还是灰度图像?
我更喜欢在这部分使用 Python 和 PIL,但如果有人有线索(或解决方案),我也可以使用 OpenCV。
原文由 Gepeto 发布,翻译遵循 CC BY-SA 4.0 许可协议
我从 jpeg 格式的 PDF 文件中提取页面图像,我需要确定每个图像是更灰度、彩色还是黑白(具有容差系数)。
我找到了一些使用 PIL 进行颜色检测的方法( 此处 和 此处),但我不知道如何回答这个简单(视觉)问题:它是黑白图像、彩色图像还是灰度图像?
我更喜欢在这部分使用 Python 和 PIL,但如果有人有线索(或解决方案),我也可以使用 OpenCV。
原文由 Gepeto 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答987 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
我尝试了 Gepeto 的解决方案,它有很多误报,因为颜色大方差可能只是偶然相似。正确的做法是计算每个像素的方差。首先缩小图像,这样您就不必处理数百万像素。
默认情况下,此函数还使用平均颜色偏差调整,我发现它改进了预测。这样做的一个副作用是它还会检测单色但非灰度图像(通常是棕褐色调的东西,该模型似乎在检测与灰度的较大偏差时有点崩溃)。您可以通过对色带平均值进行阈值处理将它们与真正的灰度区分开来。
我在包含 13,000 张摄影图像的测试集上运行了这个程序,得到了 99.1% 的准确率和 92.5% 的召回率的分类。通过使用非线性偏差调整可能会进一步提高准确性(例如,颜色值必须在 0 到 255 之间)。也许查看中位数平方误差而不是 MSE 会更好地允许例如带有小颜色标记的灰度图像。