本人的毕设要求用注意力机制挖掘数据属性列之间的联系,便于生成数据清洗规则。但是在用自注意力机处理数据时,发现相似度的计算主要基于对原始数据的embedding。因为要体现不同属性列数据间的相关性,于是考虑到了共现矩阵(目前的设想是把连续型数据离散化,大致把样本中出现的所有数据做一个简单区分就好啦)。在一通胡乱查阅资料后发现似乎可以用glove。。但是glove应该也没啥处理非文本数据的先例。有没有路过的大神能帮我看看这种思路可不可行?如果可行的化,可以对原始数据做一些怎样的处理使其能够套进glove的应用框架里。拜托啦~