决策树怎么处理分类标签比较多的数据?

就是我现在做出行时段预测,一天24小时,每隔3小时分为8组,这些是分类标签。然后数据X的话,有出行方式,性别,年龄等等。例如出行方式里面又分为6组,火车,高铁等等。最后我的模型,对测试集精度很低。然后我先剪枝,但减去几列后,依然很低,精度只有0.2左右。我现在开始觉得是不是我每列分类太多的原因,但又觉得决策树算法应该有能力处理比较复杂的分类问题,很困扰。

你的出行方式有六种,属于特征,你试一试把你的出行方式弄成ont-hot编码来试一试,这样就不存在每列分类太多的问题啦

你的预测标签是啥?8个时段?

特征和标签关系不大吧? 尤其是白天几个时段有区别吗

决策树matlab实现二分类或者多分类
https://www.csdn.net/tags/MtTaMgysMjQ0NzEtYmxvZwO0O0OO0O0O.html