可不可以帮我分析一下代码?
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.cluster import SpectralClustering
df = pd.read_excel("./team02.xlsx",header=None)
train = df[:100]
train = np.array(train)
fig,ax = plt.subplots(figsize=(12,8))
ax.scatter(x=train[:,1],y=train[:,2],s=10)
plt.scatter(x=train[1],y=train[2],s=10)
plt.show()
n_clusters = 3
"""
1、利用KMeans算法进行聚类
"""
cluster_1 = KMeans(n_clusters=n_clusters, random_state=0).fit(train)
centroid = cluster_1.cluster_centers_
# print(centroid)
y_pred = cluster_1.labels_
# print(y_pred)
color = ['red', 'orange', 'gray', 'pink']
fig, axi1 = plt.subplots(1)
for i in range(n_clusters):
axi1.scatter(train[y_pred == i, 0], train[y_pred == i, 1],
marker='o',
s=8,
c=color[i])
axi1.scatter(centroid[:, 0], centroid[:, 1], marker='x', s=100, c='black')
plt.show()
"""
2、利用SpectralClustering(谱聚类)算法进行聚类
"""
cluster_2 = SpectralClustering()
from sklearn import metrics
for index, gamma in enumerate((0.01, 0.05, 0.1, 0.5, 1)):
for index2, k in enumerate((3, 4, 5, 6, 7, 8, 9, 10)):
y_pred_tmp = SpectralClustering(n_clusters=k, gamma=gamma).fit_predict(train)
print("Calinski-Harabasz Score with gamma=", gamma, "n_clusters=", k, "score:", metrics.calinski_harabasz_score(train, y_pred_tmp))
cluster_2 = SpectralClustering()
cluster_2 = SpectralClustering(n_clusters=3, gamma=0.01)
y_pred_2 = cluster_2.fit_predict(train)
plt.scatter(train[:, 0], train[:, 1], c=y_pred_2, marker='.')
plt.show()
你要解释代码?还是只要知道做了什么
首先,代码导入了需药的库,包括pandas用于数据处理,numpy用于数组操作,matplotlib用于数据可视化,已及sklearn中的KMeans和SpectralClustering用于聚类
然后,代码读取了名为"team02.xlsx"的Excel文件,并将前100行的数据存储在train变量中,并转换为NumPy数组
然后,代码创建了一个图形窗口,并使用散点图显示了train数组中的第2列和第3列数据
再是,代码设置了聚类数目n_clusters为3
最后,下面是两个算法
1.KMeans算法进行聚类
2.SpectralClustering算法进行聚类
总结来说,机器学习已经悄然成为我们日常生活的一部分,支撑我们的汽车,医院的运营并保障我们所吃的食物。到目前为止,大型企业孵化了最先进的技术,但是真正的希望存在于下一波机器学习应用程序和工具,将围绕着机器智能各种华而不实的炒作从哈利.波特式的幻想转化为有形的社会价值。
对于机器学习能够在未来几年内创造的价值,我们有很多理由保持乐观。传统企业将训练数以百万计的公民数据科学家,将破碎的行业重塑为更高效的行业。机器学习工具将降低构建智能应用程序的门槛,推动数以百万计的新想法变成产品。垂直机器学习业务模型将让人们获得健康的食品,可靠的人身安全保障和负担得起的医疗保健服务,这是一个民主化的进程。
我们将在这些地方找到机器学习的真正价值。
文章来源:https://yqh.aliyun.com/detail/17328
原文链接:https://developer.aliyun.com/article/768653?
版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。