导入问题
就是提示有很多这个sklearn已经存在了,我是要选择哪一个进行更新吗还是要怎么样,而且我为啥会有那么多的sklearn版本呢
不知道你这个问题是否已经解决, 如果还没有解决的话:决策树,顾名思义就是一个类似于流程图的树型结构。一个决策树由根结点、分支和叶结点构成。树的最高层节点称为根结点,是整个决策树的开始。与根结点相连的不同分支,对应这个属性的不同取值,根据不同的回答转向相应的分支,在新到达的结点处做同样的分支判断,持续这一过程直到到达某个叶结点。在决策树中,每个内部结点表示一个测试,该结点的每个分支表示该测试的一个结果,每个叶结点表示一个类别。
决策树是有监督学习中的一种算法,并且是一种基本的分类与回归的方法。也就是说,决策树有两种:分类树和回归树。
分类树
分类决策树学习本质:从训练数据集中归纳出一组分类规则。
决策树的核心问题
用来衡量分枝质量的指标不纯度,分类树的不纯度用基尼系数或信息熵来衡量,回归
树的不纯度用MSE均方误差来衡量。每次分枝时,决策树对所有的特征进行不纯度计算,选取不纯度最低的特征进行分枝,分枝后,又再对被分枝的不同取值下,计算每个特征的不纯度,继续选取不纯度最低的特征进行分枝。
每分枝一层,树整体的不纯度会越来越小,决策树追求的是最小不纯度。因此,决策树会一致分枝,直到没有更多的特征可用,或整体的不纯度指标已经最优,决策树就会停止生长。
更新sklearn的步骤如下:
第一步: 使用pip工具升级sklearn。
pip install --upgrade scikit-learn
第二步: 检查更新情况。
命令如下:
python -m pip freeze | grep scikit-learn
如果结果显示新版本,则已成功升级。
scikit-learn==0.21.3
以上就是升级sklearn的步骤。