这个代码有什么问题?

用支持向量机进行乳腺癌分类监测,一连串的报错也不太看得懂,求指点。

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
from sklearn.svm import SVC,LinearSVC
from sklearn import metrics

pd.set_option('display.max_columns',None)
data = pd.read_csv("F:/data.csv",engine = "python")
print(data.shape)
data.head()
features_mean,features_se,features_worst = [], [], []
for feat in data.columns:
    if "mean" in feat:
        features_mean.append(feat)
    elif "se" in feat:
        features_se.append(feat)
    elif "worst" in feat:
        features_worst.append(feat)
mean_corr = data[features_mean].corr()
plt.figure(figsize=(8,8))
sns.heatmap(mean_corr,annot=True)
plit.show()

se_corr = data[features_se].corr()
plt.figure(figsize=(8,8))
sns.heatmap(se_corr,annot=True)
plit.show()

worst_corr = data[features_worst].corr()
plt.figure(figsize=(8,8))
sns.heatmap(worst_corr,annot=True)
plit.show()

shaixuan_feature_mean = ['radius_mean','texture_mean','smoothness_mean','compactness_mean','symmetry_mean','fractal_dimension_mean']
x_data=data[shaixuan_feature_mean]

y_data = data["diagnosis"]
del data["diagnosis"]
del data["id"]
y_data=y_data.map({'M':0, 'B':1})

from sklearn.preprocessing import StandardScaler
x_data = StandardScaler().fit_transform(x_data)

from sklearn.model_selection import train_test_split, cross_val_score
x_train, x_test, y_train, y_test = train_test_split(x_data,y_data,test_size=0.33)
svc_model = SVC().fit(x_train,y_train)
print("svc分类准确率为:",metrics.accuracy_score(svc_model.predict(x_test),y_test))
print(metrics.classification_report(svc_model.predict(x_test),y_test))

img

数据路径错误:在代码中,数据路径应该是"F:/data.csv",而不是"data.csv"。请确保文件路径正确。
缺少空格:在代码中,有一些地方的空格不太对,例如plt.figure(figsize=(8,8))应该为plt.figure(figsize=(8, 8))。请确保代码中的空格正确。
缺少导入语句:在代码中,有一些导入语句缺少了冒号(:),例如from sklearn.svm import SVC,LinearSVC应该为from sklearn.svm import SVC, LinearSVC。请确保所有导入语句都正确。

  • 帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7745376
  • 这篇博客也不错, 你可以看下爬取淘宝商品信息之数据分析篇
  • 除此之外, 这篇博客: 为什么要配置环境变量,环境变量配置,小白必看中的 很多小伙伴在入坑时对环境变量不甚了解,导致写代码时,运行时,安装新的库时频频出错,而参考这篇博客可以帮助你更快掌握 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
    • cmd命令大家都清楚,但是很多小伙伴说在cmd命令下运行文件却与大佬们效果不同,大多是无法找到这个文件存在或者没有这个命令,这就是环境变量问题了

    • 在这里插入图片描述

    • cmd命令是怎么运行的呢,当你在cmd命令下运行文件时或者使用某些命令的时候,首先会在当前目录下寻找,寻找不到时会到环境变量path中寻找,若是还没有,那就是会提示你找不到此命令或者文件

    • 在这里插入图片描述

    那如何让解决呢,首先我们可以用cd命令切换到文件所在目录运行文件,这是常用的方法,但是这种方法对于一些命令来说太麻烦,不适用
    在这里插入图片描述

    所以对于一些命令来说就要配置path环境变量了
    首先打开控制面板,找到系统
    在这里插入图片描述
    然后找到高级系统设置
    在这里插入图片描述
    点击环境变量
    在这里插入图片描述
    到这一步我们已经可以看到path了,选中path,然后点击编辑
    在这里插入图片描述
    我们发现里面已经有了一些文件链接地址,这些地址后面代表着一个一个的文件,而文件里面有着系统自带的一些命令,这些命令可以直接在cmd窗口中使用,例如ipconfig查看本机IP等信息
    在这里插入图片描述
    此时我们就可以通过右边的几个按钮接口来编辑path变量,以添加python的pip命令为例
    点击浏览,然后找到安装python的位置,找到Scripts这个文件(一般自带的pip的位置就在这里)
    在这里插入图片描述
    然后点击确定,我们发现这个文件的地址会在path中添加,然后一路点确定,确定,直到所有窗口关闭。重新打开cmd窗口
    然后用pip --version命令检查pip
    在这里插入图片描述
    出现pip版本号,可以使用
    这时使用pip命令来安装第三方库就不会有没有此命令的显示了
    拓展:
    若是还是无法安装成功出现以下这种报错是pip版本旧的问题
    在这里插入图片描述
    可以使用这个命令来更新
    在这里插入图片描述
    若还有问题
    具体请参考https://blog.csdn.net/xdc1812547560/article/details/107143537

  • 您还可以看一下 程张浩老师的微信小程序项目实战之我画你猜视频课程课程中的 商品的展示功能和删除功能小节, 巩固相关知识点