数据挖掘中数据处理的问题

我在用weka对UCI里面的人口普查的数据进行处理的时候,最后做出来的决策树的宽度很大,从我的数据集本身来看,数据集的某些分类属性的取值有很多,例如国籍这一栏就有十几二十来个取值,所以我想问一下,这种情况下,我可以用什么方法对这些分类属性进行处理,例如将中国,印度,泰国这些国家归为发展中国家,而有不会降低挖掘的准确性呢?求教~~~!

http://blog.csdn.net/lizhengnanhua/article/details/8982968