第一段代码是遍历Beijing目录下的所有文件,第二段是根据其中一个文件计算月平均值
-999.000是缺测值,如果一个月有效数据小于20天,则这个月的平均设置为缺测。
path=r"Beijing"
for root,dirs,files in os.walk(path,topdown=True):
t=[]
for name in files: #目录下的文件
with open(os.path.join(root,name),encoding='utf-8') as df:
a = pd.read_csv(df, header=0, sep='\s+', usecols=[0, 1],skiprows=0,
names=['time','data'],parse_dates=['time'],na_values=-999.000)
#t.append(a)
print(a)
df= pd.read_csv("Beijing\Y2014\1001A.txt", header=0, sep='\s+', usecols=[0, 1],skiprows=0,
names=['time','data'],parse_dates=['time'],na_values=-999.000)
df['month']=df['time'].str[6:8]
print(df.head(365))
av=df.groupby('month')['data'].mean()
print(av)
可能是通过循环,计算出每个文件数据的月平均值
希望可以把目录下所有文件的逐月平均值计算出来,并且按照月份平均