我想在 C++ 接口(cv 命名空间)中使用 k-means 和 OpenCV 对图像进行分色,结果很奇怪。我需要它来减少一些噪音。这是我的代码:
#include "cv.h"
#include "highgui.h"
using namespace cv;
int main() {
Mat imageBGR, imageHSV, planeH, planeS, planeV;
imageBGR = imread("fruits.jpg");
imshow("original", imageBGR);
cv::Mat labels, data;
cv::Mat centers(8, 1, CV_32FC1);
imageBGR.convertTo(data, CV_32F);
cv::kmeans(data, 8, labels,
cv::TermCriteria(CV_TERMCRIT_ITER, 10, 1.0),
3, cv::KMEANS_PP_CENTERS, ¢ers);
imshow("posterized hue", data);
data.convertTo(data, CV_32FC3);
waitKey();
return 0;
}
但我得到了一个奇怪的结果
第一张图:原图
第二张图片:在k-means之后。
有什么建议吗?
更新:正确的解决方案。也许有人可以帮助我优化代码?
#include "cv.h"
#include "highgui.h"
#include <iostream>
using namespace cv;
using namespace std;
int main() {
Mat src;
src = imread("fruits.jpg");
imshow("original", src);
blur(src, src, Size(15,15));
imshow("blurred", src);
Mat p = Mat::zeros(src.cols*src.rows, 5, CV_32F);
Mat bestLabels, centers, clustered;
vector<Mat> bgr;
cv::split(src, bgr);
// i think there is a better way to split pixel bgr color
for(int i=0; i<src.cols*src.rows; i++) {
p.at<float>(i,0) = (i/src.cols) / src.rows;
p.at<float>(i,1) = (i%src.cols) / src.cols;
p.at<float>(i,2) = bgr[0].data[i] / 255.0;
p.at<float>(i,3) = bgr[1].data[i] / 255.0;
p.at<float>(i,4) = bgr[2].data[i] / 255.0;
}
int K = 8;
cv::kmeans(p, K, bestLabels,
TermCriteria( CV_TERMCRIT_EPS+CV_TERMCRIT_ITER, 10, 1.0),
3, KMEANS_PP_CENTERS, centers);
int colors[K];
for(int i=0; i<K; i++) {
colors[i] = 255/(i+1);
}
// i think there is a better way to do this mayebe some Mat::reshape?
clustered = Mat(src.rows, src.cols, CV_32F);
for(int i=0; i<src.cols*src.rows; i++) {
clustered.at<float>(i/src.cols, i%src.cols) = (float)(colors[bestLabels.at<int>(0,i)]);
// cout << bestLabels.at<int>(0,i) << " " <<
// colors[bestLabels.at<int>(0,i)] << " " <<
// clustered.at<float>(i/src.cols, i%src.cols) << " " <<
// endl;
}
clustered.convertTo(clustered, CV_8U);
imshow("clustered", clustered);
waitKey();
return 0;
}
结果:
原文由 nkint 发布,翻译遵循 CC BY-SA 4.0 许可协议
我不是 OpenCV 方面的专家,所以我会给出一个与您的问题有关的一般性建议 K-means 采用向量列表,该向量本质上是一个矩阵:
你给它一个不起作用的图像。您首先必须将图像转换为这种 k-means 矩阵格式。对于源图像的每个像素,您在结果矩阵中有一行。另请注意,您应该缩放这些值,以使它们都具有相似的值。如果不这样做,x 和 y 坐标通常会比颜色具有更高的“重力”,从而导致结果不理想。 C++ 伪代码:
结果,您将获得每个像素的标签,这些标签对应于它被分配到的集群。然后,您需要确定集群的颜色 - 这可以从获取中心像素颜色值到计算集群的平均/中值颜色。确定颜色后,只需遍历图像并将像素设置为其群集颜色:
如果您更喜欢使用 HSV 而不是 RGB,只需使用 HSV 值而不是 RGB 值。
OpenCV 可能具有完全执行我上面描述的转换的功能,但我无法使用 Google 快速找到它们。