关于#机器学习#的问题,如何解决?

可不可以帮我分析一下代码?


import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from sklearn.cluster import KMeans
from sklearn.cluster import SpectralClustering

df = pd.read_excel("./team02.xlsx",header=None)
train = df[:100]
train = np.array(train)

fig,ax = plt.subplots(figsize=(12,8))
ax.scatter(x=train[:,1],y=train[:,2],s=10)

plt.scatter(x=train[1],y=train[2],s=10)

plt.show()


n_clusters = 3

"""
1、利用KMeans算法进行聚类
"""
cluster_1 = KMeans(n_clusters=n_clusters, random_state=0).fit(train)
centroid = cluster_1.cluster_centers_
# print(centroid)

y_pred = cluster_1.labels_
# print(y_pred)

color = ['red', 'orange', 'gray', 'pink']
fig, axi1 = plt.subplots(1)
for i in range(n_clusters):
    axi1.scatter(train[y_pred == i, 0], train[y_pred == i, 1],
                 marker='o',
                 s=8,
                 c=color[i])
axi1.scatter(centroid[:, 0], centroid[:, 1], marker='x', s=100, c='black')
plt.show()


"""
2、利用SpectralClustering(谱聚类)算法进行聚类
"""
cluster_2 = SpectralClustering()
from sklearn import metrics
for index, gamma in enumerate((0.01, 0.05, 0.1, 0.5, 1)):
    for index2, k in enumerate((3, 4, 5, 6, 7, 8, 9, 10)):
        y_pred_tmp = SpectralClustering(n_clusters=k, gamma=gamma).fit_predict(train)
        print("Calinski-Harabasz Score with gamma=", gamma, "n_clusters=", k, "score:", metrics.calinski_harabasz_score(train, y_pred_tmp))


cluster_2 = SpectralClustering()
cluster_2 = SpectralClustering(n_clusters=3, gamma=0.01)
y_pred_2 = cluster_2.fit_predict(train)
plt.scatter(train[:, 0], train[:, 1], c=y_pred_2, marker='.')
plt.show()

你要解释代码?还是只要知道做了什么

首先,代码导入了需药的库,包括pandas用于数据处理,numpy用于数组操作,matplotlib用于数据可视化,已及sklearn中的KMeans和SpectralClustering用于聚类

然后,代码读取了名为"team02.xlsx"的Excel文件,并将前100行的数据存储在train变量中,并转换为NumPy数组

然后,代码创建了一个图形窗口,并使用散点图显示了train数组中的第2列和第3列数据

再是,代码设置了聚类数目n_clusters为3

最后,下面是两个算法
1.KMeans算法进行聚类
2.SpectralClustering算法进行聚类

  • 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/260794
  • 你也可以参考下这篇文章:机器学习中,为何经常要对数据归一化?
  • 除此之外, 这篇博客: 机器学习下一个万亿级的增长从哪来?中的 我们将何去何从? 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  • 总结来说,机器学习已经悄然成为我们日常生活的一部分,支撑我们的汽车,医院的运营并保障我们所吃的食物。到目前为止,大型企业孵化了最先进的技术,但是真正的希望存在于下一波机器学习应用程序和工具,将围绕着机器智能各种华而不实的炒作从哈利.波特式的幻想转化为有形的社会价值。

    对于机器学习能够在未来几年内创造的价值,我们有很多理由保持乐观。传统企业将训练数以百万计的公民数据科学家,将破碎的行业重塑为更高效的行业。机器学习工具将降低构建智能应用程序的门槛,推动数以百万计的新想法变成产品。垂直机器学习业务模型将让人们获得健康的食品,可靠的人身安全保障和负担得起的医疗保健服务,这是一个民主化的进程。

    我们将在这些地方找到机器学习的真正价值。


    文章来源:https://yqh.aliyun.com/detail/17328

    原文链接:https://developer.aliyun.com/article/768653?

    版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 您还可以看一下 刘伶华老师的软件测试经典面试题剖析课程中的 工作中有遇到什么困难,怎么解决的?小节, 巩固相关知识点