数据预处理中提到,退化数据复原,是什么意思,能不能举几个数据退化的例子?或者有什么参考文献之类的?
http://xueshu.baidu.com/s?wd=paperuri:(2f157eaa31aaed5101a52dc18f3c8761)&filter=sc_long_sign&sc_ks_para=q%3D%E5%9F%BA%E4%BA%8E%E5%B0%8F%E6%B3%A2%E5%88%86%E6%9E%90%E7%9A%84%E9%80%80%E5%8C%96%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86%E7%9A%84%E4%BA%A7%E5%93%81%E5%AF%BF%E5%91%BD%E9%A2%84%E6%B5%8B%E6%96%B9%E6%B3%95&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=18411665238094119158我也是不太懂,这个可以参考下
数据因为信息的变化而丧失有效性。比如说,你去“赶集网”采集了100个求购信息。10天以后,比如一些人已经买到了,或者不再需要购买了。1/3的信息可能就无效了。再比如说,你从多个数据源获得数据,那么合并这些数据必然有重复和不一致的,那么会造成一些数据失效,退化的数据相当于你数据中的噪声,需要先过滤掉,否则基于无效的数据进行分析得到的结果自然就不准确。
就是随着时空的顺流,信息会一点一点消失。