今有2017-2018年每个季度的每股指标数据,共22720条数据记录,数据全部来源于国泰安CSMAR数据库,部分数据记录及表结构如表右所示:其中Stkcd-股票代码、Accper-截止日期、F090301B-归属于母公司每股收益、F090601B-每股营业收入、F091001A-每股净资产、F091301A-每股资本公积、F091501A-每股未分配利润、F091801B-每股经营活动产生的现金流量净额。问题如下:
1.对每个股票代码,计算每个季度每股收益同比增长率,并找出连续4个季度每股收益同比增长率大于20%的股票代码。
2.找出2017、2018年度每股资本公积和每股未分配利润最大的10只股票代码,并通过柱状图、子图的方法可视化展现出来。
3.取2018年度的数据,对以上6个指标作主成分分析,要求提取信息占比在95%以上,并写出每个主成分的表达式和说明其主成分的意义。
4.基于第3步提取的主成分进行K-均值聚类分析,并获取其聚类中心。