如何使用spark mlib进行疾病概率的预测?

毕设选题:基于spark的心血管疾病预测
疑问:疾病预测是一个二分类问题,只有患病和不患病两种可能 我应该选择哪种模型才能够得到患者患病的概率啊? 要的是概率 不是是否患病 谢谢额

二分类本来输出的就是概率,只不过平时习惯性得到0 和 1 是概率划分过界限后得到的结果。很多模型也都是给出了两个预测接口 predict, predict_proba