萌新跟着一本书学习,里面有个读取csv文件的代码:
on_time_dataframe = spark.read.format('com.databricks.spark.csv').options(
header = 'true',
treatEmptyValuesAsNulls = 'true', )
.load('data/On_Time_On_Time_Performance_2015.csv.bz2')
这条语句怎么执行都出错,把文件上传到hdfs上报错,直接读取本地文件也报错(加了file://)
报错如下:
https://blog.csdn.net/tang_xiaotang/article/details/94394721