将混在一起的两类或多类数据有效拆分

我有一列数据,是两类数据混在一起的,另外还有很多噪声干扰数据,请问有什么好的算、程序或者软件可以有效的将两类数据拆分开来或者将其中一种删除掉吗

两类或多类数据拆分,可以是 聚类方法,也可以是分类方法,都是非常简单的。
但是,两类数据分类,这个问题说的不明确。
数据是文本还是数值,或者其它数据类型?
所谓两类,是如何分类的,两类之间有没有明确的区分依据?
打个比方,中国所有省份,构成一列数据,这个数据能不能称为两类?
这取决于分类的方式。如果按是否首都来拆分,是有明确的分类结果的,属于分类问题。如果按经济发展水平来拆分,就是聚类问题,分成两类,三类,多类都可以,即使分为两类也结果也不是唯一的。