为什么 cv2.COLOR_RGB2GRAY 和 cv2.COLOR_BGR2GRAY 会给出不同的结果?

新手上路,请多包涵

我一直认为将图像从彩色转换为灰度很简单:每个像素的强度将是每个颜色通道强度的平均值。但我注意到 cv2.COLOR_RGB2GRAYcv2.COLOR_BGR2GRAY 给出了不同的结果。当我对它们进行试验时,我还发现它也不同于每个颜色通道的平均强度。

PS 当我发现这一点时,我完全感到困惑

img_read_as_color[:,:,0]/3+img_read_as_color[:,:,1]/3+img_read_as_color[:,:,2]/3 == (img_read_as_color[:,:,0]+img_read_as_color[:,:,1]+img_read_as_color[:,:,2])/3

但是当显示为图像时

(img_read_as_color[:,:,0]+img_read_as_color[:,:,1]+img_read_as_color[:,:,2])/3

看起来像

img_read_as_color[:,:,0]+img_read_as_color[:,:,1]+img_read_as_color[:,:,2]

有人可以向我解释为什么会这样吗?

我的完整代码:

 import matplotlib.pyplot as plt
import cv2

sample = r'G:\Python\knight-mare\screenshots\2020-07-12-02-40-44.jpg'
img_read_as_grayscale = cv2.imread(sample, cv2.IMREAD_GRAYSCALE)
img_read_as_color = cv2.imread(sample, cv2.IMREAD_COLOR)
img_RGB_to_grayscale = cv2.cvtColor(img_read_as_color, cv2.COLOR_RGB2GRAY)
img_BGR_to_grayscale = cv2.cvtColor(img_read_as_color, cv2.COLOR_BGR2GRAY)
plt.imshow(img_read_as_grayscale)
plt.title('img_read_as_grayscale')
plt.show()
plt.imshow(img_read_as_color)
plt.title('img_read_as_color')
plt.show()
plt.imshow(img_RGB_to_grayscale)
plt.title('img_RGB_to_grayscale')
plt.show()
plt.imshow(img_BGR_to_grayscale)
plt.title('img_BGR_to_grayscale')
plt.show()

channel_avg_div_separately = img_read_as_color[:,:,0]/3+img_read_as_color[:,:,1]/3+img_read_as_color[:,:,2]/3
channel_avg_div_together = (img_read_as_color[:,:,0]+img_read_as_color[:,:,1]+img_read_as_color[:,:,2])/3
channel_sum = img_read_as_color[:,:,0]+img_read_as_color[:,:,1]+img_read_as_color[:,:,2]
plt.imshow(channel_avg_div_separately)
plt.title('channel_avg_div_separately')
plt.show()
plt.imshow(channel_avg_div_together)
plt.title('channel_avg_div_together')
plt.show()
plt.imshow(channel_sum)
plt.title('channel_sum')
plt.show()

图像读取为灰度图像读取为彩色读取为由 RGB2GRAY 转换为彩色的图像图像读取为由 BGR2GRAY 转换为彩色图像读取为彩色,每个通道除以 3,然后相加图像读取为彩色,所有通道加在一起,然后除以 3图像读取为彩色,只需添加通道

原文由 Kosh 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.5k
2 个回答
  1. RGB->gray 转换实际上不是平均数——不同通道的权重不同。具体来说:
 gray_pixel = 0.114 * blue_pixel + 0.299 * red_pixel + 0.587 * green_pixel

文档 中也提到了这一点。因此,预计 RGB2GRAY 和 BGR2GRAY 会给出不同的结果。

  1. 关于 sum-then-divide 和 divide-then-sum 方法之间的差异,即
img_read_as_color[:,:,0]/3+img_read_as_color[:,:,1]/3+img_read_as_color[:,:,2]/3

(img_read_as_color[:,:,0]+img_read_as_color[:,:,1]+img_read_as_color[:,:,2])/3

回想一下 cv2.imread 返回一个 uint8 numpy 数组。因此,后一种操作(所有通道在除法之前组合在一起)会导致溢出(事实上,在这种情况下,ipython3 会给我一个运行时警告)。在标记为 channel_avg_div_togetherchannel_sum 的图像中也可以看到类似溢出的伪影。

原文由 vasiliykarasev 发布,翻译遵循 CC BY-SA 4.0 许可协议

好吧,首先转换不是简单的平均,更不用说线性转换了。计算公式为 RGB[A] to Gray:Y←0.299⋅R+0.587⋅G+0.114⋅BOpenCV Docs

显然 OpenCV 使用相同的公式转换为灰度,无论其 BGR 还是 RGB 用作输入,但在使用公式时保留通道顺序,因此传递错误的转换顺序将导致错误的结果。

一个很好的例子是我最近看到的一篇 论坛帖子,作者比较了从 RGB 和 BGR 转换后的结果。右下角像素具有以下值。(图片来自链接的帖子/作者)

 CV_BGR2GRAY: Lower right corner: 0.1140 * 163 + 0.5870 * 182 + 0.2989 * 203 ≈ 186

CV_RGB2GRAY: Lower right corner: 0.1140 * 203 + 0.5870 * 182 + 0.2989 * 163 ≈ 179

所以 tl;dr:如果您传递错误的通道顺序,转换后的输出将会不同。

CV_BGR2灰色

CV_RGB2GRAY

原文由 Atif Anwer 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
logo
Stack Overflow 翻译
子站问答
访问
宣传栏