如何判断两张图是否相似?
查到了很多算法,流程都是“特征提取”,“特征对比”。以下列出了三个常见算法的浅显的介绍,

平均哈希算法

平均哈希算法是三种Hash算法中最简单的一种,它通过下面几个步骤来获得图片的Hash值,这几个步骤分别是(1) 缩放图片;(2)转灰度图; (3) 算像素均值;(4)根据相似均值计算指纹。具体算法如下所示:
1.1 aHash得到图片Hash值地算法
得到图片的ahash值后,比较两张图片ahash值的汉明距离,通常认为汉明距离小于10的一组图片为相似图片。

例子:

1.2 原图以及灰度后的图像

其中转为8x8尺寸的Lena对应的数据矩阵为:

1.3 数据矩阵

很容得到如上矩阵所有元素的均值a= 121.328125, 将上述矩阵中大于或等于a的元素置为1, 小于a的元素置为0,可得:

1.4转换为1的矩阵
所以可得Lena图的aHash为

   1011111010011110100111011010100110101011101000110000111000101100

   将二进制形式ahash转十六进制hash为

   be9e9da9aba30e2c

将两张图片进行平均hash后,再计算出各自的汉明距离

图Lena(noise):

图Lena(noise)

图Barbara:

图Barbara

图汉明距离:

图汉明距离

感知哈希算法

感知哈希算法是三种Hash算法中较为复杂的一种,它是基于DCT(离散余弦变换)来得到图片的hash值(补充:关于DCT具体如何转换参考 https://www.jianshu.com/p/b92... ),其算法几个步骤分别是(1) 缩放图片;(2)转灰度图; (3) 计算DCT;(4)缩小DCT; (5)算平均值;(6) 计算指纹。具体算法如下所示:
感知hash的步骤

差异哈希算法

相比pHash,dHash的速度要快的多,相比aHash,dHash在效率几乎相同的情况下的效果要更好,它是基于渐变实现的。其算法几个步骤分别是(1) 缩放图片(2)转灰度图; (3)算差异值;
(4)算平均值; (5)计算指纹。具体算法如下所示:
差异哈希流程

文章参考了:http://t.zoukankan.com/kalafi...
具体平均hash的测试代码详见:
https://github.com/yuanting20...

本文由博客一文多发平台 OpenWrite 发布!

乔瑟琳
1 声望0 粉丝