看看不是学本专业的小bai吧!

img


想要转成以下图为例的样子。以病人序号为索引,将同一时间内做项目名称、结果单位、结果状态、标本类型为一行。同一病人序列号的不同时间做的检查变为下一行。

img

可在读取表格时使用usecols选取成两个数据框然后合并即可:

import pandas as pd
pd.set_option('display.max_columns',None)
df1 = pd.read_excel('t0216.xlsx',usecols=[0,1,2,3,4,5])
df2 = pd.read_excel('t0216.xlsx', usecols=[0, 6, 7, 8, 9, 10])
df2.columns=df1.columns
df=pd.concat([df1,df2],ignore_index=True)
df=df.sort_values(by='报告时间')
print(df)

运行结果:

序号    项目                 报告时间   结果单位 结果状态 标本类型
0  z184  D二聚体  09/18/2018 12:07:00   0.71    H   血浆
2  z184    纤维  09/18/2018 12:07:00   2.70    N   血浆
1  z184   胱氨酸  09/18/2018 13:44:00  17.20    N   血清
3  z184  甘油三酯  09/18/2018 13:44:00   1.22    N   血清

Excel数据处理?
读入数据,遍历再写入新文件。
是否需要处理多个文件?
原始数据格式都是一行两项检查结果?