统计+建模
影响因素分析常用方法
1. 单因子分析:某因素不同x值对应的y值分布;
优点:实现方式简单;缺点:量少,且分布不均时,准确性低;因素多时,效率低;
2. 比较分析:不同y值对应的不同因素的x的平均值;
优点:实现方式简单,因素多时,效率高。缺点:量少,且分布不均时,准确性低;
3. 相关性分析
优点:比较科学;缺点:成线性相关时,才有明显的相关性;
4. 回归
优点:控制变量法;缺点:需要线性拟合程度高,即r平方较大时,得出来的系数才具有说服力。
5. 方差分析(单因素、双因素方差分析)
优点:通过计算组内误差、组间误差识别出各因素对y值的影响,既可以发现单个因素的影响,也可以发现多个因素之间相互作用的影响,比如品牌和地区对销售的影响;缺点:计算量大,一般能只判断2个因子的交互作用,3个以上因素的计算公式比较复杂
6. 分类树(随机森林)
优点:控制变量法;缺点:需要模型准确率高时得出的结论才具有说服力。
业务分析师常用前2种,因为实现简单,但当数据结构比较复杂时,准确度不高;
用python 读取数据然后分析
常见的统计分析工具包括:
可以使用以下统计学方法进行数据分析: