关于数据分析的短语匹配需求

背景:

项目有个功能需求,用户搜索日志(上亿条数据)中,根据关键字匹配搜索短语。并生成每个关键字匹配的短语数组。

例子:

表一:tab_1

用户id搜索短语
1篮球资讯
2篮球比赛
3足球比赛

表一:tab_2

关键词id搜索关键词
1篮球
2足球

要求:根据tab_2中的关键词 关联 tab_1,找出对应匹配的短语集合。(上亿条数据)

关键词id搜索关键词
篮球篮球资讯 ,篮球比赛
足球球足球比赛

问题:求一个较好的解决方案,数据库选型+实现。PS:得是数据库自身能实现的,而不是写大量代码。万般感谢

将数据存入hive 通过hsql不是就可以直接实现吗