对比两个不同格式的excel的表格
一个表格格式如下
一个表格格式如下
用Python做一个工具比对两个表的差异并用黄色标注
我的方法是把他们转化成一种格式进行比对,但是只能生成两个一样格式的excel表格,要是想就在原来的表格上标注怎么办?
你这个问题还没解决呀,昨天看你描述不是很清楚,现在看懂了
a1是横着那张表,a2是竖着那张表。可以把两个表不同的地方标注出来,然后生成两张新的表,当然你也可以直接覆盖原来的表只要改一下文件地址和原来一样就行。
import openpyxl as xl
from openpyxl.styles import PatternFill
wb1 = xl.load_workbook('/Users/jary/Documents/a1.xlsx')
wb2 = xl.load_workbook('/Users/jary/Documents/b1.xlsx')
ws1 = wb1.active
ws2 = wb2.active
rows_number = len(list(ws1.rows))
columns_number = len(list(ws1.columns))
row = 1
yellow_fill = PatternFill(fill_type='solid', fgColor="FFFF00")
for r in range(2,rows_number+1):
for c in range(2,columns_number+1):
source_place = (r,c)
match_place = (row,2)
if ws1.cell(r,c).value != ws2.cell(row,2).value:
ws1.cell(r,c).fill = yellow_fill
ws2.cell(row,2).fill = yellow_fill
row+=1
wb1.save('/Users/jary/Documents/a2.xlsx')
wb2.save('/Users/jary/Documents/b2.xlsx')
昨天的代码我改了一下,已经完全符合你现在横着的表生成竖着的表的格式了
# 以下是实现代码
import pandas as pd
df = pd.read_excel("~/Documents/a1.xlsx",index_col=0)
columns = df.columns
index = df.index
result = pd.DataFrame(columns=['index','value'],index=[])
for i in index:
for c in columns:
result = result.append({'index':f"{i}{c}",'value':df.loc[i,c]},ignore_index=True)
result.to_excel("~/Documents/b1.xlsx",index=False,header=False)
你可以使用下面这个代码把横着的表生成竖着的表,然后在对比试试
话说,你解决没?
没解决的话,我这边也可以处理
问题解决了吗?