- 对经典数据集 Iris 进行 k 均值聚类
iris 数据集简介:iris 数据集的中文名是鸢尾花卉数据集,包含 150 个样本, 即对应了数据集的每行数据。每行数据的前 4 列为样本的特征信息,即花萼长度
(length of sepals)、花萼宽度(length of petals)、花瓣长度(width of sepals)、花瓣宽度(width of petals);每行数据的第 5 列为样本的类别信息,包含了 3 种鸢尾花,即山鸢尾(Iris setosa)、变色鸢尾(Iris versicolor)和维吉尼亚鸢尾(Iris virginica)。数据示例如图所示,数据在 python 中的 sklearn 模块和 matlab 中均已提供,附件 Iris.txt 中也有相应数据,需要的同学可以自行下载。
图 2 iris 数据集示例

1) 通过代码输出聚类中心坐标,以及聚类后的类别结果。
2) 将 iris 数据集中的数据、数据类别等信息通过图的方式显示出来。
3) 将聚类后的聚类中心、数据类别等信息通过图的方式显示出来。。
4) 输出 k 均值聚类的准确率。准确率的公式如下:
准确率 分类正确的样本数100%
样本总数
你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答
本次提问扣除的有问必答次数,已经为您补发到账户,我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。