糖尿病是一种慢性疾病,老年人群易得,目前要去医院检查才能知道是否得病,为此,某公司想从人的特征来分析是否患病,你能帮助该公司完成这件事吗?
提示:
(1)建立机器学习模型以准确预测数据集中的人是否患有糖尿病。
(2)预测下赵盼儿(怀孕次数0,血糖浓度3.2舒张压(毫米汞柱)70 肱三头肌皮肤褶皱厚度16两个小时血清胰岛素80BM 25 疾病血统指数 0.5 身高165 年龄20)是否患病?
本数据集内含十个属性列 Pergnancies:怀孕次数 Glucose:血糖浓度
BloodPressure:舒张压(毫米汞柱)
SkinThickness:肱三头肌皮肤褶皱厚度(毫米) Insulin:两个小时血清胰岛素(U/毫升)
BMI:身体质量指数,体重除以身高的平方
Diabets Pedigree Function:疾病血统指数是否和遗传相关,Height:身高(厘米) Age:年龄
Outcome:0表示不患病,1表示患病。
该数据集为sklearn自带数据集 load diabetes
kaggle上去看看有没有对应的代码吧
分类问题,用决策树、GBDT、随机森林、XGBoost、神经网络这些都可以啊,如果你需要的只是调包调参然后得到较好的结果的话。