现在hive中有个字段里面含有tab建。把这个结果导成文件插入表中多两个字段。然后用regexp_replace(字段, '\s+', '')替换tab键。select出来是替换成功了。但是导成文件,文件里这个字段还是有tab键。现在该如何处理?导文件语句:hive -e "use 账户; select *,regexp_replace(字段, '\s+', '') from table" > /目录/文件名.dat
现在该如何处理。
最后解决办法:重新建了一张表,insert into 新表 select 结果集。然后再把新表数据导成文件,再做后续工作。
为什么不通过更新字段的方式进行处理一下tab键,你也可以试试trim(字段)
替换tab用 regexp_replace(字段, '\t', '')
\s+ 是空格不是tab, \t 才是tab
如果原表的数据已经错位,建议直接修改hdfs对应位置的文件