读取数据
import pandas as pd
df = pd.read_csv("./SalesData.csv") # 这里填入数据集路径
df = df.sample(n = 500,random_state=x) # random_state 为随机数种子,x填入学号后三位。
df.to_csv("./数据集.csv", encoding="utf_8_sig") # 修改后的数据集将被保存在与此python文件相同的路径下。
数据集修改完成后请重新读取新的数据集(# 后为注释,可删除)
为每个数值变量绘制柱状图,哪些变量显示存在异常值?
使用IQR方法识别所有数值变量的异常值。
找出明显不是正态分布的数值变量。
求出所有数值变量的中位数。