新手上路，请多包涵

我有一个 python 图像处理函数，它试图获取图像的主色。我使用了在这里找到的函数 https://github.com/tarikd/python-kmeans-dominant-colors/blob/master/utils.py

它有效，但不幸的是我不太明白它的作用，我了解到 np.histogram 相当慢，我应该使用 cv2.calcHist 因为它比这个快 40 倍： https：/ /docs.opencv.org/trunk/d1/db7/tutorial_py_histogram_begins.html

我想了解我必须如何更新代码才能使用 cv2.calcHist 或更好，我必须输入哪些值。

我的功能

def centroid_histogram(clt):
    # grab the number of different clusters and create a histogram
    # based on the number of pixels assigned to each cluster
    num_labels = np.arange(0, len(np.unique(clt.labels_)) + 1)
    (hist, _) = np.histogram(clt.labels_, bins=num_labels)

    # normalize the histogram, such that it sums to one
    hist = hist.astype("float")
    hist /= hist.sum()

    # return the histogram
    return hist

pprint 的 clt 是这个，不确定这是否有帮助

KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
    n_clusters=1, n_init=10, n_jobs=1, precompute_distances='auto',
    random_state=None, tol=0.0001, verbose=0)

我的代码可以在这里找到： https ://github.com/primus852/python-movie-barcode

我是一个非常初学者，所以非常感谢任何帮助。

按要求：

样本图像

最主要的颜色：

rgb(22,28,37)

直方图的计算时间：

0.021515369415283203s

原文由 PrimuS 发布，翻译遵循 CC BY-SA 4.0 许可协议

python python-3.x numpy opencv

阅读 1.3k

2 个回答

得票最新

社区维基

发布于
2022-11-16

✓ 已被采纳

可以建议使用 np.unique 和 np.bincount 获得最主要颜色的两种方法。此外，在链接页面中，它讨论了 bincount 作为更快的替代方案，因此这可能是可行的方法。

方法#1

 def unique_count_app(a):
    colors, count = np.unique(a.reshape(-1,a.shape[-1]), axis=0, return_counts=True)
    return colors[count.argmax()]

方法#2

 def bincount_app(a):
    a2D = a.reshape(-1,a.shape[-1])
    col_range = (256, 256, 256) # generically : a2D.max(0)+1
    a1D = np.ravel_multi_index(a2D.T, col_range)
    return np.unravel_index(np.bincount(a1D).argmax(), col_range)

验证和计时 1000 x 1000 密集范围内的彩色图像 [0,9) 以获得可重现的结果 -

 In [28]: np.random.seed(0)
    ...: a = np.random.randint(0,9,(1000,1000,3))
    ...:
    ...: print unique_count_app(a)
    ...: print bincount_app(a)
[4 7 2]
(4, 7, 2)

In [29]: %timeit unique_count_app(a)
1 loop, best of 3: 820 ms per loop

In [30]: %timeit bincount_app(a)
100 loops, best of 3: 11.7 ms per loop

进一步提振

利用 multi-core 和 numexpr 大数据模块进一步提升 -

 import numexpr as ne

def bincount_numexpr_app(a):
    a2D = a.reshape(-1,a.shape[-1])
    col_range = (256, 256, 256) # generically : a2D.max(0)+1
    eval_params = {'a0':a2D[:,0],'a1':a2D[:,1],'a2':a2D[:,2],
                   's0':col_range[0],'s1':col_range[1]}
    a1D = ne.evaluate('a0*s0*s1+a1*s0+a2',eval_params)
    return np.unravel_index(np.bincount(a1D).argmax(), col_range)

时间 -

 In [90]: np.random.seed(0)
    ...: a = np.random.randint(0,9,(1000,1000,3))

In [91]: %timeit unique_count_app(a)
    ...: %timeit bincount_app(a)
    ...: %timeit bincount_numexpr_app(a)
1 loop, best of 3: 843 ms per loop
100 loops, best of 3: 12 ms per loop
100 loops, best of 3: 8.94 ms per loop

原文由 Divakar 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2022-11-16

@Divakar 给出了很好的答案。但是如果你想将自己的代码移植到 OpenCV，那么：

     img = cv2.imread('image.jpg',cv2.IMREAD_UNCHANGED)

    data = np.reshape(img, (-1,3))
    print(data.shape)
    data = np.float32(data)

    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)
    flags = cv2.KMEANS_RANDOM_CENTERS
    compactness,labels,centers = cv2.kmeans(data,1,None,criteria,10,flags)

    print('Dominant color is: bgr({})'.format(centers[0].astype(np.int32)))

您的图像的结果：

主色是：bgr([41 31 23])

耗时：0.10798478126525879 秒

原文由 zindarod 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

RGB 图像中最主要的颜色 - OpenCV / NumPy / Python

样本图像

最主要的颜色：

直方图的计算时间：

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

请问numpy如何简化以下代码？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译