如何将 RGB 图像（3 通道）转换为灰度图像（1 通道）并保存？

Question

新手上路，请多包涵

在处理深度学习项目时，我有很多不需要颜色的图像。我救了他们：

 import matplotlib.pyplot as plt

plt.imsave('image.png', image, format='png', cmap='gray')

但是后来当我检查图像的形状时，结果是：

 import cv2
img_rgb = cv2.imread('image.png')
print(img_rgb.shape)
(196,256,3)

因此，即使我查看的图像是灰度图像，我仍然有 3 个颜色通道。我意识到我必须做一些代数运算才能将这 3 个通道转换为 1 个单通道。

我已经尝试过线程“ How can I convert an RGB image into grayscale in Python? ”中描述的方法，但我很困惑。

例如，何时使用以下方法进行转换：

 from skimage import color
from skimage import io
img_gray = color.rgb2gray(io.imread('image.png'))
plt.imsave('image_gray.png', img_gray, format='png')

但是，当我加载新图像并检查其形状时：

 img_gr = cv2.imread('image_gray.png')
print(img_gr.shape)
(196,256,3)

我在该线程上尝试了其他方法，但结果是一样的。我的目标是获得具有 (196,256,1) 形状的图像，考虑到卷积神经网络的计算密集度要低得多。

任何帮助，将不胜感激。

原文由 J. Devez 发布，翻译遵循 CC BY-SA 4.0 许可协议

python python-3.x 图片 rgb grayscale

阅读 2k

1 个回答

得票最新

社区维基

1

发布于
2022-11-17

你的第一个代码块：

 import matplotlib.pyplot as plt
plt.imsave('image.png', image, format='png', cmap='gray')

这是将图像保存为 RGB，因为 cmap='gray' 在向 imsave 提供 RGB 数据时被忽略（参见 pyplot 文档）。

您可以通过取三个波段的平均值将数据转换为灰度，或者像您一样使用 color.rgb2gray ，或者我倾向于使用 numpy：

 import numpy as np
from matplotlib import pyplot as plt
import cv2

img_rgb = np.random.rand(196,256,3)
print('RGB image shape:', img_rgb.shape)

img_gray = np.mean(img_rgb, axis=2)
print('Grayscale image shape:', img_gray.shape)

输出：

 RGB image shape: (196, 256, 3)
Grayscale image shape: (196, 256)

img_gray 现在是正确的形状，但是如果你使用 plt.imsave 保存它，它仍然会写三个波段，每个像素 R == G == B。这是因为，我相信 PNG 文件需要三个（或四个）波段。警告：我不确定这一点：我希望得到纠正。

 plt.imsave('image_gray.png', img_gray, format='png')
new_img = cv2.imread('image_gray.png')
print('Loaded image shape:', new_img.shape)

输出：

 Loaded image shape: (196, 256, 3)

避免这种情况的一种方法是将图像保存为 numpy 文件，或者将一批图像保存为 numpy 文件：

 np.save('np_image.npy', img_gray)
new_np = np.load('np_image.npy')
print('new_np shape:', new_np.shape)

输出：

 new_np shape: (196, 256)

您可以做的另一件事是保存灰度 png（使用 imsave ），但仅在第一个波段中读取：

 finalimg = cv2.imread('image_gray.png',0)
print('finalimg image shape:', finalimg.shape)

输出：

 finalimg image shape: (196, 256)

原文由 jmsinusa 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

如何将 RGB 图像（3 通道）转换为灰度图像（1 通道）并保存？

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

这段代码为什么不能获取到数据？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？

Stack Overflow 翻译