#Excel数据处理
朋友们,有没有知道怎么把图中A列内容是连续的(如标红的HF1.2.3.4)并且B列内容是相同的(如标红的1865113)数据筛选出来
如果A列固定长度为三位字符串,且筛选出按 1,2,3,4排序的子数据框,可这样写代码:
import pandas as pd
df=pd.read_excel('t0310_1.xlsx',header=None,names=['A','B','C','D','E'])
res=pd.DataFrame()
for i in range(len(df)):
if int(df.loc[i, 'A'][2]) == 1 and int(df.loc[i+1, 'A'][2]) == 2 and int(df.loc[i+2, 'A'][2]) == 3 and int(df.loc[i+3, 'A'][2]) == 4 and df.loc[i, 'B'] == df.loc[i+1, 'B'] == df.loc[i+2, 'B'] == df.loc[i+3, 'B']:
res=pd.concat([res,df.loc[i:i+3, :]])
print(res)
运行结果:
F:\2022\pythontest>t5
A B C D E
3 LF1 1838789 . C A
4 LF2 1838789 . C A
5 LF3 1838789 . C A
6 LF4 1838789 . C A
8 HF1 1865113 . T A
9 HF2 1865113 . T A
10 HF3 1865113 . T A
11 HF4 1865113 . T A
如对你有帮助,请点击采纳按钮~~
A列数据有什么特点, 都字母加一个数字吗? 后面的数字有可能大过9吗?
如果是规范的数据,可以考虑用openpyxl 打开后遍历。 结果是直接标注,还是另外生成表格?