【任务】
(1)用pandas库读取house. sale. price. csv文件,查看前5行、后2行。
(2)选择Id、 GarageCond 、LotArea、 OverallCond 、YrSold、SalePrice共6列数据,将缺失值全部丢弃处理,并将处理后结果导出到文本文件house total price. txt,要求数据之间用空格分隔,每行末尾包含换行符。
(3)读取文本文件house[total price. txt,计算列SalePrice与列LotArea的商(即SalePrice/LotArea),并作为一个新的列unitPrice添加到原始数据,导出到新的Excel文件house unit price. xlsx中。
(4)读取Excel文件house unit price. xlsx,利用列 GarageCond 分组,计算unitPrice的均值,并按照unit Price均值降序排列后以柱状图可视化显示该均值。要求以列 GarageCond 为x轴,轴刻度分别为Excellent、Good、Typical、Fair、Poor,包括图例、图标题,填充颜色为蓝色,并保存为 househeating unit price. png,要求分辨率不低于300 dpi。
(5)读取Excel文件house unit price.x1sx,利用列 GarageCond 分组,计算 OverallCond 的均值,并按照 OveralICond 均值升序排列后以柱状图可视化显示该均值。要求以列 GarageCond 为x轴,轴刻度分别为Excellent、Good、Typical、Fair、Poor、NA,包括图例、图标题,填充颜色为蓝色,并保存为 househeating overallcond . png,要求分辨率不低于300dpi。
有数据嘛
用pandas和matplotlib结合不就好了🐵🐵