请教一个数据分析方面的问题:
-->现有数据情况:
(1)有40个医学样本,针对它们获取了两组可以体现疗效差异的、完全异质的数据集A和B;
(2)40个样本之间存在个体疗效差异但没有分组指标;
-->问题:
如何通过A和B的相关性分析,指导40个样本的较好疗效和较差疗效分组?可否用Python实现整个分析?
-->我能想到的解决办法:
对A和B数据分别做正态分析,将95%置信区间以外两端的样本视为较好、较差组。但是,这样就有两个问题:1)不是基于二者的相关性进行的分组;2)A和B数据不一定呈正态分布;3)95置信区间外的样本太少,分组没有统计意义……
不知道有没有可以利用python完美解决的办法?