数据挖掘中数据处理的问题

我在用weka对UCI里面的人口普查的数据进行处理的时候，最后做出来的决策树的宽度很大，从我的数据集本身来看，数据集的某些分类属性的取值有很多，例如国籍这一栏就有十几二十来个取值，所以我想问一下，这种情况下，我可以用什么方法对这些分类属性进行处理，例如将中国，印度，泰国这些国家归为发展中国家，而有不会降低挖掘的准确性呢？求教~~~！

http://blog.csdn.net/lizhengnanhua/article/details/8982968