用支持向量机进行乳腺癌分类监测,一连串的报错也不太看得懂,求指点。
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
from sklearn.svm import SVC,LinearSVC
from sklearn import metrics
pd.set_option('display.max_columns',None)
data = pd.read_csv("F:/data.csv",engine = "python")
print(data.shape)
data.head()
features_mean,features_se,features_worst = [], [], []
for feat in data.columns:
if "mean" in feat:
features_mean.append(feat)
elif "se" in feat:
features_se.append(feat)
elif "worst" in feat:
features_worst.append(feat)
mean_corr = data[features_mean].corr()
plt.figure(figsize=(8,8))
sns.heatmap(mean_corr,annot=True)
plit.show()
se_corr = data[features_se].corr()
plt.figure(figsize=(8,8))
sns.heatmap(se_corr,annot=True)
plit.show()
worst_corr = data[features_worst].corr()
plt.figure(figsize=(8,8))
sns.heatmap(worst_corr,annot=True)
plit.show()
shaixuan_feature_mean = ['radius_mean','texture_mean','smoothness_mean','compactness_mean','symmetry_mean','fractal_dimension_mean']
x_data=data[shaixuan_feature_mean]
y_data = data["diagnosis"]
del data["diagnosis"]
del data["id"]
y_data=y_data.map({'M':0, 'B':1})
from sklearn.preprocessing import StandardScaler
x_data = StandardScaler().fit_transform(x_data)
from sklearn.model_selection import train_test_split, cross_val_score
x_train, x_test, y_train, y_test = train_test_split(x_data,y_data,test_size=0.33)
svc_model = SVC().fit(x_train,y_train)
print("svc分类准确率为:",metrics.accuracy_score(svc_model.predict(x_test),y_test))
print(metrics.classification_report(svc_model.predict(x_test),y_test))
数据路径错误:在代码中,数据路径应该是"F:/data.csv",而不是"data.csv"。请确保文件路径正确。
缺少空格:在代码中,有一些地方的空格不太对,例如plt.figure(figsize=(8,8))应该为plt.figure(figsize=(8, 8))。请确保代码中的空格正确。
缺少导入语句:在代码中,有一些导入语句缺少了冒号(:),例如from sklearn.svm import SVC,LinearSVC应该为from sklearn.svm import SVC, LinearSVC。请确保所有导入语句都正确。
cmd命令大家都清楚,但是很多小伙伴说在cmd命令下运行文件却与大佬们效果不同,大多是无法找到这个文件存在或者没有这个命令,这就是环境变量问题了
cmd命令是怎么运行的呢,当你在cmd命令下运行文件时或者使用某些命令的时候,首先会在当前目录下寻找,寻找不到时会到环境变量path中寻找,若是还没有,那就是会提示你找不到此命令或者文件
那如何让解决呢,首先我们可以用cd命令切换到文件所在目录运行文件,这是常用的方法,但是这种方法对于一些命令来说太麻烦,不适用
所以对于一些命令来说就要配置path环境变量了
首先打开控制面板,找到系统
然后找到高级系统设置
点击环境变量
到这一步我们已经可以看到path了,选中path,然后点击编辑
我们发现里面已经有了一些文件链接地址,这些地址后面代表着一个一个的文件,而文件里面有着系统自带的一些命令,这些命令可以直接在cmd窗口中使用,例如ipconfig查看本机IP等信息
此时我们就可以通过右边的几个按钮接口来编辑path变量,以添加python的pip命令为例
点击浏览,然后找到安装python的位置,找到Scripts这个文件(一般自带的pip的位置就在这里)
然后点击确定,我们发现这个文件的地址会在path中添加,然后一路点确定,确定,直到所有窗口关闭。重新打开cmd窗口
然后用pip --version命令检查pip
出现pip版本号,可以使用
这时使用pip命令来安装第三方库就不会有没有此命令的显示了
拓展:
若是还是无法安装成功出现以下这种报错是pip版本旧的问题
可以使用这个命令来更新
若还有问题
具体请参考https://blog.csdn.net/xdc1812547560/article/details/107143537