在jupyter上读取文件后,如何提取文档中的date这一列日期中的年,不要月和日
在 Jupyter Notebook 中,可以使用 pandas 库来读取数据文件并进行数据处理。以下是一份参考代码,用于读取文档中的 date 列,并提取年份:
import pandas as pd
# 读取文件,假设文件名为 data.csv,并且包含 date 和 value 两列数据
df = pd.read_csv("data.csv")
# 提取日期信息,即获取 date 列中的字符串前 4 个字符(即年份)
df['year'] = df['date'].apply(lambda x: int(x[:4]))
# 打印结果
print(df[['date', 'year']])
在以上代码中,我们首先使用 pd.read_csv() 函数读取了名为 data.csv 的数据文件,并将其保存到一个 DataFrame 对象中。假设该文件包含两列数据:date 和 value。
接着,我们使用 apply() 方法和 Python 的匿名函数 lambda 来操作 date 列,将每行数据中的年份提取出来,并存储到一个新的 year 列中。具体地,我们使用 x[:4] 来截取日期字符串的前 4 个字符,即年份信息,并将其转化为整数类型。
最后,我们使用 print() 函数打印结果,其中 df[['date', 'year']] 表示返回 df 数据集中的 date 和 year 两列数据。运行以上代码后,可以看到输出结果中,新增的 year 列中已经成功提取了所有日期数据的年份信息。