环境:hive on saprk (hive3.1.2 spark3.0.0)
先使用group by对create_date去重,然后使用datediff函数对create_date操作,对结果强转BIGINT,结果全为0,
然后使用hive on mr结果正常
Spark SQL结果正常。
强转INT、STRING、DECIMAL结果正常。
代码(hive on spark):(使用union all模拟数据)可直接拿代码测试
with tmp as (
select '2021-12-09' as create_date
union all
select '2021-12-10' as create_date
union all
select '2021-12-09' as create_date
union all
select '2021-12-10' as create_date
union all
select '2021-12-11' as create_date
union all
select '2021-12-12' as create_date
union all
select '2021-12-13' as create_date
)
select
tmp.create_date,
cast(datediff('2021-12-15', tmp.create_date) as bigint)as day
from tmp
group by tmp.create_date
结果:
tmp.create_date day
2021-12-13 0
2021-12-10 0
2021-12-09 0
2021-12-11 0
2021-12-12 0
使用hive on mr结果正常
Spark SQL结果正常。
强转INT、STRING、DECIMAL结果正常。
通过修改表结构为INT,问题解决,但是想知道该问题出现的原因。
你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答
本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。
因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。