1.Hadoop伪分布式环境搭建 2.HDFS分布式文件系统的基本操作 3.Sqoop数据导入导出 4.Hive的基本操作
HADOOP伪分布式搭建 只需要花费20分钟
1.配置java环境
2.开启ssh(不管是集群还是伪分布式都要开启)
3.配置hadoop环境(只需要在几个.xml.进行配置即可,sbin/start-all可能会报错,要在相关的sh文件里面进行配置)
HDFS基本命令
非常简单,常用的就那几个
SQOOP的导入导出
可以随用随查,有固定的格式
HIVE的基本操作
hive建议重点掌握一下,离线数仓的核心,大数据写SQL可能会多一些