就是两列时间序列数据怎么用apriori算法做关联分析呢?比如水位一列数据 位移一列数据 那怎么得出水位和位移这两个效应量关联度吗?
Python 编程实现
关联规则所使用的的Apriori算法要求输入的数据应为布尔类型吗?所以数值类型就要符号化?
看到一篇文献是这样做的:原始数据—>滑动窗口L=10截取原始数据得到N个子序列—>线性拟合—>标准化斜率—>子序列符号化处理—>Apriori算法
搞不明白文中说从由每段斜率组成的事务集中找出频繁项集是什么意思?
输出水位与位移这两监测效应量的关联性
原始数据—>滑动窗口L=10截取原始数据得到N个子序列—>线性拟合—>标准化斜率—>子序列符号化处理—>Apriori算法
我觉得这个说的挺清楚的啊,关联算法本身解决的是各个商品的关联度,其实就是分类变量的关联关系。所以这里不是转成布尔值,符号化处理是转成了分类量。所以这里的处理逻辑就是将原始数据按滑动窗口分成N个子序列(N个商品),线性拟合得出斜率(斜率是连续值通过符号化处理转成分类变量,相同的符号比如1a,1b ,就认为是同一个商品),然后就是典型的关联算法处理逻辑了
文献连接发下,