Python数据分析问题步骤求解代码

(1)读取之前保存的“酒店数据1.xlsx”

(2)将“类型”和“名字”设置为层次化索引,并交换索引的位置。然后将层次化索引取消。

(3)将数据集转置,获取转置后的index和columns。

(4)数据离散化,按照价格将酒店分为3个等级,0-500为C,500-1000为B,大于1000为A,列名设置为“价格等级”。

(5)获取评分均值最高和最低的地区的数据,分别使用append和concat方法将获取的两个数据集合并。

(6)数据离散化,按照评分人数将酒店平均分为3个等级,三个等级的酒店数量尽量保持一致。评分人数最多的为A,最少的为C。列名设置为“热门等级”。

(7)选出评分人数为A,价格也为A的酒店数据,计算其平均评分。

(8)取价格最高的5个酒店的数据,使用stack和unstack方法实现dataframe和Series之间的转换。

(9)纵向拆分数据集,分为df1和df2,df1包含名字,类型,城市,地区,df2包含名字,地点,评分,评分人数,价格,价格等级,热门等级。

(10)将df2按照价格进行排序,重新设置df2的索引。索引值等于价格排名。

(11)使用merge方法将df1和df2合并。

(12)将合并后的数据集保存数据到“酒店数据2.xlsx”。