Bagging抽出n个数据集后,每个数据集的样本量K都是一样的,如何进行去重处理的话,不能保证每个数据集的样本量相同,所以需不需要进行去重处理呢?
bagging因为是有放回,那确实是需要去重处理的,后面具体的集成算法,跟adaboost等一致,为:
参考链接: