考虑一个包含400个示例的二进制数据集,其中一半属于类a,另一半属于类B。
接下来考虑两个决策树桩(即深度为1的树)T1和T2,每个树桩都有两个子树。对于T1,它的左子类在类A中有150个例子,在类B中有50个例子;对于T2,它的左子元素在类A中有0个例子,在类b中有100个例子(你应该推断出在右子元素中有什么)。
2.1对于T1和T2的每个时,计算相应的分类误差、熵(以e为基底)和基尼杂质,将你的答案四會五入到小数点后两位。(注意:每个叶子的值/预测是属于该叶子的所有示例中的大多数类。)
2.2根据分类误差、条件灿(队e为基底)、基尼杂质加权,分别比较T1和T2(仰报的两种不同分割)的质量,将你的各案四合五入到小数点后两位。