hive 如果做到两个月的数据关联

问题遇到的现象和发生背景

李白2022-02数据如何与李白2021-01数据关联?李白2022-01数据如何与李白2021-12数据关联?求

问题相关代码,请勿粘贴截图
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果

两种方法,
一、自关联,
两个关联条件:

  • a.姓名等于b.姓名
  • a.月份等于b.月份加一个月

二、开窗函数
使用lead或者lag函数可以获取下一行或者上一行的数据


hive中的日期计算比较麻烦,需要转成unixtimestamp格式才能进行计算,下面这个sql就是获取 '2022-01' 的上一个月,并以相同格式表示,即 '2021-12'

select from_unixtime(unix_timestamp(add_months(from_unixtime(UNIX_TIMESTAMP('2022-01','yyyy-MM'), 'yyyy-MM-dd HH:mm:ss'),-1),'yyyy-MM-dd'),'yyyy-MM')