想用肘关节法看图片最优聚类 输入维度有问题怎么解决?


img=cv2.imread('/content/drive/MyDrive/no-fog vs fog/8_8_1.jpg')
Z = img.reshape((-1, 3))
Z = np.array(Z).reshape(1, -1)
whw_df = np.float32(Z)
whw_df = [[i] for i in whw_df]
##KMeans进行选取聚类数目
#分别利用手肘法和轮廓系数对聚类的数目进行探索:
#手肘法
# 利用SSE选择k
whw_SSE = []  # 存放每次结果的误差平方和
for i in range(2, 8):  # 尝试要聚成的类数
    whw_estimator = KMeans(n_clusters=i)  # 构造聚类器
    whw_estimator.fit(whw_df) #存入数组(数据的列名标签)
    whw_SSE.append(whw_estimator.inertia_)
X = range(2, 8)  # 跟k值要一样
fig = plt.figure(figsize=(8,6))
plt.xlabel('聚类数目')
plt.ylabel('SSE')
plt.plot(X, whw_SSE,'o-' )
plt.title("K值在肘关节处最优")
plt.show()  # 画出图

该回答引用GPTᴼᴾᴱᴺᴬᴵ

从您提供的代码看,图片已经被读入,reshape 成为 (n_samples, n_features) 的二维数组 Z,再转化为一维数组 whw_df。但是在这里,一维数组 whw_df 中的每个元素又被包装成一个列表,这一步看上去没有必要。因此,可以直接把 whw_df 的元素改成三个维度,即 whw_df = whw_df.reshape(-1, 1, 3)。

此外,聚类算法在图像分割中通常使用 RGB 颜色空间,而不是将每个像素的 R、G、B 三个分量分开考虑。因此,将 Z 按行展平为一维数组后,应该将其转化为一个二维数组,即 Z = img.reshape((-1, 3))。

修改后的代码如下:

img = cv2.imread('/content/drive/MyDrive/no-fog vs fog/8_8_1.jpg')
Z = img.reshape((-1, 3))
whw_df = np.float32(Z).reshape(-1, 1, 3)

# 利用SSE选择k
whw_SSE = []  # 存放每次结果的误差平方和
for i in range(2, 8):  # 尝试要聚成的类数
    whw_estimator = KMeans(n_clusters=i)  # 构造聚类器
    whw_estimator.fit(whw_df)  # 存入数组(数据的列名标签)
    whw_SSE.append(whw_estimator.inertia_)

X = range(2, 8)  # 跟k值要一样
fig = plt.figure(figsize=(8,6))
plt.xlabel('聚类数目')
plt.ylabel('SSE')
plt.plot(X, whw_SSE,'o-')
plt.title("K值在肘关节处最优")
plt.show()  # 画出图

希望这能解决您的问题。

望采纳,
首先,您需要将图像转换为矩阵,然后使用KMeans算法来计算每个聚类的误差平方和,最后,您可以根据肘关节法的原理,在误差平方和函数图中找到最优的聚类数目。