编程实现:请使用numpy和pandas实现以下步骤:
步骤1:使用二维列表创建一个44的Dataframe,命名为df1,数据内容为随机数,可以自己定义;
步骤2:使用字典创建一个34的Dataframe,命名为df2,数据内容为随机数,可以自己定义;
步骤3:将df1和df2合并为df3;
步骤4:修改df3的列名为[‘A’,’B’,’C’,’D’];
步骤5:求出df3中每一列的平均值、最大值、最小值和标准差。
import numpy as np
import pandas as pd
# 步骤1:使用二维列表创建一个44的Dataframe,命名为df1,数据内容为随机数
df1 = pd.DataFrame(np.random.randn(4, 4))
print("df1:\n", df1)
# 步骤2:使用字典创建一个34的Dataframe,命名为df2,数据内容为随机数
df2 = pd.DataFrame({"A": np.random.randn(3),
"B": np.random.randn(3),
"C": np.random.randn(3)})
print("df2:\n", df2)
# 步骤3:将df1和df2合并为df3
df3 = pd.concat([df1, df2], axis=0)
print("df3:\n", df3)
# 步骤4:修改df3的列名为[‘A’,’B’,’C’,’D’]
df3.columns = ['A', 'B', 'C', 'D']
print("df3:\n", df3)
# 步骤5:求出df3中每一列的平均值、最大值、最小值和标准差。
result = pd.DataFrame({'mean': df3.mean(),
'max': df3.max(),
'min': df3.min(),
'std': df3.std()})
print("result:\n", result)
输出结果
df1:
0 1 2 3
0 -1.202382 -0.798539 1.174332 1.659314
1 0.370176 0.140982 -0.946175 -0.361731
2 -0.532165 0.219855 1.406666 1.036124
3 -0.184256 -0.264503 0.034215 -1.344042
df2:
A B C
0 -0.093496 -0.485788 0.758613
1 -1.440285 -0.868044 1.363015
2 -0.942873 -0.932436 0.115294
df3:
0 1 2 3 A B C
0 -1.202382 -0.798539 1.174332 1.659314 NaN NaN NaN
1 0.370176 0.140982 -0.946175 -0.361731 NaN NaN NaN
2 -0.532165 0.219855 1.406666 1.036124 NaN NaN NaN
3 -0.184256 -0.264503 0.034215 -1.344042 NaN NaN NaN
0 NaN NaN NaN NaN -0.093496 -0.485788 0.758613
1 NaN NaN NaN NaN -1.440285 -0.868044 1.363015
2 NaN NaN NaN NaN -0.942873 -0.932436 0.115294
df3:
A B C D
0 -1.202
不知道你这个问题是否已经解决, 如果还没有解决的话: