如何提取文档中的date这一列日期中的年，不要月和日

在jupyter上读取文件后，如何提取文档中的date这一列日期中的年，不要月和日

在 Jupyter Notebook 中，可以使用 pandas 库来读取数据文件并进行数据处理。以下是一份参考代码，用于读取文档中的 date 列，并提取年份：


import pandas as pd

# 读取文件，假设文件名为 data.csv，并且包含 date 和 value 两列数据
df = pd.read_csv("data.csv")

# 提取日期信息，即获取 date 列中的字符串前 4 个字符（即年份）
df['year'] = df['date'].apply(lambda x: int(x[:4]))

# 打印结果
print(df[['date', 'year']])

在以上代码中，我们首先使用 pd.read_csv() 函数读取了名为 data.csv 的数据文件，并将其保存到一个 DataFrame 对象中。假设该文件包含两列数据：date 和 value。

接着，我们使用 apply() 方法和 Python 的匿名函数 lambda 来操作 date 列，将每行数据中的年份提取出来，并存储到一个新的 year 列中。具体地，我们使用 x[:4] 来截取日期字符串的前 4 个字符，即年份信息，并将其转化为整数类型。

最后，我们使用 print() 函数打印结果，其中 df[['date', 'year']] 表示返回 df 数据集中的 date 和 year 两列数据。运行以上代码后，可以看到输出结果中，新增的 year 列中已经成功提取了所有日期数据的年份信息。