如何将表中有相似属性的名称做关联

现在表中有许多数据,大致分为人物、综艺、电影、电视剧、动画不同的类型,现在要对这些数据做相互关联。

人物和电影之类的关联我是从网上抓电影的百科数据,然后用人名去匹配电影里的演员、导演就能发现人和电影之间的关联。

但是我想发现不同电影、电视剧、动画之间的关联如何操作。比如西游记、西游记续集、西游降魔篇、七龙珠它们之间是有联系的,不知道机器能不能做这种关联,还是只能人工做?

肯定是可以的,举个列子,我写过一个对几百G的数据的新闻做情感分析,用的是大数据,但是关键是算法.像西游记,西游记续集,西游降魔篇、七龙珠这些你可以定义一些keyWord,能对其主题进行很好的识别,然后对关键字进行数据处理,这就很简单了.那么问题来了,怎么定义关键字?这个貌似得人工来,目前再走机器得路的话恭喜你,机器学习你不得不考虑,能够对视频能容目前经行鉴定得还没听过比较成熟得.个人觉得,你可以根据你爬得对电影电视剧得相关介绍,百科什么的进行文本分析就可以了,比如分析两个文本得相关性,这个就和我前面说的那个情感分析很像了.

像这种关联其实就是一种查询啦,你真的去做关联是不太现实的。总不能说都是根据孙悟空关联的吧~那么换一个 三国和西游记 也有关联啊 都是四大名著。 这种的话其实就需要做模糊查询 比如搜孙悟空 直接去数据库查 名称和简介 演员什么都查 只要匹配孙悟空就显示出来 没有孙悟空 就会去查孙悟 悟空 孙 悟 空 这个就是我们平常搜索电影时候的查询结果(当然其实也是看你的具体需求,任性就是只匹配孙悟空,其他的都不搜)。都没问题,我想你要匹配也是大概为了这个原因。
还有其他的问题,或者并非我所理解的这样,可以继续讨论

其实我觉得这种语义上的关联是比较难实现的 但是你可以通过关键字来做 比如都含有西游的 列入西游系列 都含有现代的列为一个系列

你可以同过一条小数据(比如西游记)拓展关于西游的所有数据,再根据另一个(比如七龙珠)拓展他的数据,这时比对两者的数据相同的内容则是他的关联
这个可以同过机器来进行查找比对