数据挖掘纯度怎么计算?

最近在用weka里面的simplekmeans进行分析,要求是要计算纯度,我想问一下wek里面有可以计算纯度的工具吗,还是有什么别的特别好的计算纯度的工具,顺便问一下纯度的公式怎么算?

利用Weka进行数据(Big Data)分析和挖掘实战视频课程

应该有数据分析的功能,但可能不会像你想的那么简单(有公式)。

所谓的“纯度”其实就是信噪比,关键是噪声数据的识别,这个没有统一的方法,而且也不可能有。往往需要结合经验实际来判断。