项目背景:
一位萌萌哒测试,自学python,因为对比翻译太过耗费时间,希望可以节省点时间,希望各位多多帮助,感谢
需求描述:
因为软件比较复杂,人工对比翻译后的rc比较繁琐,所以想弄一个工具代替人工操作。
思路描述:
先将rc文件转换为txt文件,随后将中文rc文件的每行数据写入到一个表格excel1,将外文的rc文件每行数据写入到另一个表格excel2,并将两个表格合并,此时,这个表格中含有两列数据暂定名为,一列为中文rc文件中每一行的数据,另一列为外文rc文件中的每一行数据。然后对比这两个RC文件,因为包含部分相同的内容,所以需要把相同的内容去除。总体的翻译excel3表格中,中外文是对应的,类似如下图的样子,现在需要把处理后的两个RC文件生成的excel1、excel2表格内容,根据中文一行一行的在如下总体翻译表格excel3中搜索,然后再获取excel3右侧翻译后的俄语,将获取到的俄语再在excel2表格中的俄语列进行搜索,查看是否存在,若存在则证明RC文件翻译正确,若不存在,将不存在的中文记录在一个新的excel3表格中,后续人工核验。
需要解答的:
现在excel1和excel2均已完成数据处理,需要进行搜索比对了,没什么思路,希望能提供些思路
这个是excel1
这个是excel2
这个是excel3
希望能提供下思路、方法或者代码,万分感谢!
该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下:根据你的需求描述,你想要使用Python对两个Excel文件进行搜索和比对。以下是一个可能的思路和代码示例来实现你的需求:
导入所需的库:
import pandas as pd
读取 Excel 文件并获取数据:
excel1_data = pd.read_excel('excel1.xlsx')
excel2_data = pd.read_excel('excel2.xlsx')
excel3_data = pd.read_excel('excel3.xlsx')
请确保将 excel1.xlsx
、excel2.xlsx
和 excel3.xlsx
替换为你的实际文件名和路径。
对比两个 RC 文件的中文和外文内容:
matched_data = pd.merge(excel1_data, excel2_data, on='中文列名', how='inner')
在上述代码中,将 中文列名
替换为你的 Excel 表中包含中文的列的列名。这将执行一个内连接操作,找到中文和外文列中的匹配项。
搜索并比对翻译后的俄语:
for index, row in matched_data.iterrows():
chinese_text = row['中文列名']
russian_text = row['俄语列名']
result = excel3_data[excel3_data['中文列名'] == chinese_text]
if not result.empty and russian_text in result['俄语列名'].values:
print(f"中文:{chinese_text},俄语:{russian_text},匹配成功")
else:
print(f"中文:{chinese_text},俄语:{russian_text},匹配失败")
请将 '中文列名'
和 '俄语列名'
替换为实际的列名。在上述代码中,我们使用了 iterrows()
方法遍历每一行数据,并使用条件语句检查翻译后的俄语是否存在于 Excel3 中。
将不匹配的记录保存到新的 Excel 文件中:
mismatched_data = pd.DataFrame(columns=['中文列名', '俄语列名'])
for index, row in matched_data.iterrows():
chinese_text = row['中文列名']
russian_text = row['俄语列名']
result = excel3_data[excel3_data['中文列名'] == chinese_text]
if not result.empty and russian_text not in result['俄语列名'].values:
mismatched_data = mismatched_data.append({'中文列名': chinese_text, '俄语列名': russian_text}, ignore_index=True)
mismatched_data.to_excel('mismatched_data.xlsx', index=False)
下面是一个完整的代码示例,包括以上提到的所有步骤:
import pandas as pd
# 读取 Excel 文件
excel1_data = pd.read_excel('excel1.xlsx')
excel2_data = pd.read_excel('excel2.xlsx')
excel3_data = pd.read_excel('excel3.xlsx')
# 对比两个 RC 文件的中文和外文内容
matched_data = pd.merge(excel1_data, excel2_data, on='中文列名', how='inner')
# 搜索并比对翻译后的俄语
for index, row in matched_data.iterrows():
chinese_text = row['中文列名']
russian_text = row['俄语列名']
result = excel3_data[excel3_data['中文列名'] == chinese_text]
if not result.empty and russian_text in result['俄语列名'].values:
print(f"中文:{chinese_text},俄语:{russian_text},匹配成功")
else:
print(f"中文:{chinese_text},俄语:{russian_text},匹配失败")
# 将不匹配的记录保存到新的 Excel 文件中
mismatched_data = pd.DataFrame(columns=['中文列名', '俄语列名'])
for index, row in matched_data.iterrows():
chinese_text = row['中文列名']
russian_text = row['俄语列名']
result = excel3_data[excel3_data['中文列名'] == chinese_text]
if not result.empty and russian_text not in result['俄语列名'].values:
mismatched_data = mismatched_data.append({'中文列名': chinese_text, '俄语列名': russian_text}, ignore_index=True)
mismatched_data.to_excel('mismatched_data.xlsx', index=False)
请确保将 'excel1.xlsx'
、'excel2.xlsx'
、'excel3.xlsx'
替换为你的实际文件名和路径。同样,将 '中文列名'
和 '俄语列名'
替换为你的实际列名。
此代码将依次执行读取 Excel 文件、对比中文和外文内容、搜索并比对翻译后的俄语,最后将不匹配的记录保存到名为 'mismatched_data.xlsx'
的新 Excel 文件中。
希望这个完整的代码示例对你有帮助。
如果以上回答对您有所帮助,点击一下采纳该答案~谢谢
给你个思路,来回读写excel明显效率很低,可以直接把rc文件转成txt,然后读取txt里面的数据,之后使用sqlite(一个很轻型的数据库,不需要额外下载东西),来对比数据,这样性能和效率肯定要比excel简单,先把俄文和中文依次写入两个表,之后再通过sql去对比两个表的内容写入到第三个表中。最后再把数据表中的数据保存到excel里面。
import sqlite3
# 创建 SQLite 数据库连接
conn = sqlite3.connect('rc_data.db')
c = conn.cursor()
# 创建中文 RC 表格
c.execute('''CREATE TABLE IF NOT EXISTS chinese_rc (id INTEGER PRIMARY KEY, text TEXT)''')
# 创建外文 RC 表格
c.execute('''CREATE TABLE IF NOT EXISTS foreign_rc (id INTEGER PRIMARY KEY, text TEXT)''')
# 创建用于存储不匹配的记录的表格
c.execute('''CREATE TABLE IF NOT EXISTS unmatched_records (
id INTEGER PRIMARY KEY,
chinese_text TEXT,
foreign_text TEXT
)''')
# 读取并插入中文 RC 文件的内容
with open('chinese_rc.txt', 'r', encoding='utf-8') as f:
chinese_lines = f.readlines()
for line in chinese_lines:
c.execute("INSERT INTO chinese_rc (text) VALUES (?)", (line.strip(),))
# 读取并插入外文 RC 文件的内容
with open('foreign_rc.txt', 'r', encoding='utf-8') as f:
foreign_lines = f.readlines()
for line in foreign_lines:
c.execute("INSERT INTO foreign_rc (text) VALUES (?)", (line.strip(),))
# 提交更改并关闭数据库连接
conn.commit()
conn.close()
# 检查不匹配的记录
conn = sqlite3.connect('rc_data.db')
c = conn.cursor()
# 查询不匹配的记录并插入到 unmatched_records 表格
for chinese_line, foreign_line in zip(chinese_lines, foreign_lines):
c.execute("SELECT id FROM chinese_rc WHERE text=?", (chinese_line.strip(),))
chinese_id = c.fetchone()
c.execute("SELECT id FROM foreign_rc WHERE text=?", (foreign_line.strip(),))
foreign_id = c.fetchone()
if not chinese_id or not foreign_id:
# 如果中文或外文在对应表格中找不到匹配,插入到 unmatched_records 表格
c.execute("INSERT INTO unmatched_records (chinese_text, foreign_text) VALUES (?, ?)", (chinese_line.strip(), foreign_line.strip()))
# 提交更改并关闭数据库连接
conn.commit()
conn.close()
然后是导出数据到excel,这个需要安装一下openpyxl库
import sqlite3
import openpyxl
# 连接 SQLite 数据库
conn = sqlite3.connect('rc_data.db')
c = conn.cursor()
# 查询 unmatched_records 表格中的数据
c.execute("SELECT * FROM unmatched_records")
data = c.fetchall()
# 创建一个新的 Excel 工作簿
wb = openpyxl.Workbook()
ws = wb.active
# 添加表头
ws.append(['ID', 'Chinese Text', 'Foreign Text'])
# 将数据写入 Excel
for row in data:
ws.append(row)
# 保存 Excel 文件
wb.save('unmatched_records.xlsx')
# 关闭数据库连接
conn.close()
希望思路和代码对你有帮助
【以下回答由 GPT 生成】
针对您的问题,我可以提供以下解决方案和代码示例。
pandas
和 openpyxl
。import pandas as pd
from openpyxl import load_workbook
pandas
的 read_excel
函数。excel1 = pd.read_excel('excel1.xlsx')
excel2 = pd.read_excel('excel2.xlsx')
excel3
,用于存储合并后的数据。excel3 = pd.DataFrame(columns=['中文数据', '外文数据'])
for index, row in excel1.iterrows():
chinese_data = row['中文数据']
matched_row = excel2[excel2['外文数据'] == chinese_data]
if not matched_row.empty:
english_data = matched_row.iloc[0]['外文数据']
excel3 = excel3.append({'中文数据': chinese_data, '外文数据': english_data}, ignore_index=True)
excel4
表格中。excel4 = pd.DataFrame(columns=['中文数据'])
for index, row in excel1.iterrows():
chinese_data = row['中文数据']
matched_row = excel3[excel3['中文数据'] == chinese_data]
if matched_row.empty:
excel4 = excel4.append({'中文数据': chinese_data}, ignore_index=True)
with pd.ExcelWriter('excel3.xlsx') as writer:
excel3.to_excel(writer, sheet_name='Sheet1', index=False)
with pd.ExcelWriter('excel4.xlsx') as writer:
excel4.to_excel(writer, sheet_name='Sheet1', index=False)
import pandas as pd
from openpyxl import load_workbook
# 加载 excel1 和 excel2 的数据
excel1 = pd.read_excel('excel1.xlsx')
excel2 = pd.read_excel('excel2.xlsx')
# 创建 excel3 和 excel4
excel3 = pd.DataFrame(columns=['中文数据', '外文数据'])
excel4 = pd.DataFrame(columns=['中文数据'])
# 遍历 excel1 中的每一行数据,在 excel2 中进行搜索匹配,将匹配到的数据添加到 excel3 中
for index, row in excel1.iterrows():
chinese_data = row['中文数据']
matched_row = excel2[excel2['外文数据'] == chinese_data]
if not matched_row.empty:
english_data = matched_row.iloc[0]['外文数据']
excel3 = excel3.append({'中文数据': chinese_data, '外文数据': english_data}, ignore_index=True)
# 检查 excel1 中未在 excel3 中找到匹配的行数据,并将这些行数据添加到 excel4 中
for index, row in excel1.iterrows():
chinese_data = row['中文数据']
matched_row = excel3[excel3['中文数据'] == chinese_data]
if matched_row.empty:
excel4 = excel4.append({'中文数据': chinese_data}, ignore_index=True)
# 将 excel3 和 excel4 的数据写入新的 excel 文件
with pd.ExcelWriter('excel3.xlsx') as writer:
excel3.to_excel(writer, sheet_name='Sheet1', index=False)
with pd.ExcelWriter('excel4.xlsx') as writer:
excel4.to_excel(writer, sheet_name='Sheet1', index=False)
请注意,上述代码假设使用的是 .xlsx
格式的 Excel 文件。如果使用的是 .xls
格式的文件,您可以将代码中的 .xlsx
改为 .xls
。
希望这些信息对您有所帮助!如果您还有任何问题,请随时提问。
【相关推荐】
你的需求描述非常清晰,这有助于我为你提供正确的解决方案。
首先,对于你的需求,我建议使用Python编程语言,配合pandas库和openpyxl库进行操作。以下是一个基本的步骤:
import openpyxl
from openpyxl import load_workbook
# 加载工作簿
workbook = load_workbook(filename='your_file.xlsx')
# 选择工作簿的工作表
worksheet = workbook.active
import pandas as pd
# 读取工作表的数据为DataFrame
df1 = pd.read_excel(io='excel1.xlsx', engine='openpyxl')
df2 = pd.read_excel(io='excel2.xlsx', engine='openpyxl')
# 对比df1和df2,找出相同的行
df_common = df1[df1.isin(df2)].dropna()
# 找出df1中不同的行
df_diff1 = df1.drop(df_common.index)
# 找出df2中不同的行
df_diff2 = df2.drop(df_common.index)
# 将相同的数据输出到新的Excel文件
output_common = pd.concat([df_common['中文'], df_common['俄语']]).to_frame('对比结果')
output_common.to_excel('output_common.xlsx', index=False)
# 将不同的数据输出到新的Excel文件
output_diff1 = pd.concat([df_diff1['中文'], df_diff1['俄语']]).to_frame('对比结果')
output_diff1.to_excel('output_diff1.xlsx', index=False)
output_diff2 = pd.concat([df_diff2['中文'], df_diff2['俄语']]).to_frame('对比结果')
output_diff2.to_excel('output_diff2.xlsx', index=False)
以上代码是一个基本的框架,你可能需要根据你的具体需求进行调整。例如,如果你的Excel表格的结构或列的名称不同,你需要相应地修改代码。此外,如果数据量非常大,你可能需要进一步优化代码以提高效率。
示例代码如下:
import pandas as pd
# 将中文rc文件转为txt文件
with open('中文rc文件.rc', 'r', encoding='utf-16') as f:
lines = f.readlines()
with open('中文rc文件.txt', 'w', encoding='utf-8') as f:
f.writelines(lines)
# 将外文rc文件转为txt文件
with open('外文rc文件.rc', 'r', encoding='utf-16') as f:
lines = f.readlines()
with open('外文rc文件.txt', 'w', encoding='utf-8') as f:
f.writelines(lines)
# 将中文rc文件的每行数据写入到一个表格excel1
with open('中文rc文件.txt', 'r', encoding='utf-8') as f:
data1 = {'中文': f.readlines()}
df1 = pd.DataFrame(data1)
df1['中文'] = df1['中文'].str.strip() # 去除换行符和空格
df1.to_excel('excel1.xlsx', index=False)
# 将外文rc文件每行数据写入到另一个表格excel2
with open('外文rc文件.txt', 'r', encoding='utf-8') as f:
data2 = {'外文': f.readlines()}
df2 = pd.DataFrame(data2)
df2['外文'] = df2['外文'].str.strip() # 去除换行符和空格
df2.to_excel('excel2.xlsx', index=False)
# 将excel1和excel2合并为excel3
df3 = pd.merge(df1, df2, left_index=True, right_index=True)
df3.to_excel('excel3.xlsx', index=False)
# 读取excel3
df3 = pd.read_excel('excel3.xlsx')
# 去除相同的内容
df3 = df3.drop_duplicates()
# 在excel3中搜索中文,并获取翻译后的俄语
def translate(chinese):
# 省略翻译代码
return russian
df3['俄语'] = df3['中文'].apply(translate)
# 在excel2中搜索俄语,查看是否存在
df2 = pd.read_excel('excel2.xlsx')
df3['是否存在'] = df3['俄语'].isin(df2['外文'])
# 若不存在,记录在新表格中
df4 = df3[~df3['是否存在']]
df4 = df4[['中文']]
df4.to_excel('不存在的中文.xlsx', index=False)
结合GPT给出回答如下请题主参考
您好,根据您提供的信息,我理解您需要用Python处理多个Excel文件并且进行查询操作。以下是一些可能对您有用的建议:
使用pandas库来处理Excel文件。pandas是一个很强大的数据处理库,可以轻松读取、处理和写入Excel文件。例如,您可以使用pandas.read_excel()方法读取Excel文件,并使用pandas.DataFrame()创建一个数据框来存储数据。
在进行查询操作之前,您需要先将所有Excel文件中的数据合并成一个数据框。您可以使用pandas.concat()方法来将多个数据框合并成一个大数据框。
在数据框中进行查询操作,您可以使用pandas.DataFrame.loc[]或pandas.DataFrame.query()方法。例如,如果您想查询“名称”列中包含特定字符串的所有行,您可以使用以下语句:
df.loc[df['名称'].str.contains('特定字符串')]
或
df.query('名称.str.contains("特定字符串")')
df.to_excel('result.xlsx', index=False)
希望这些建议可以帮助到您。如果您需要更具体的帮助,请提供更多细节或示例数据,我将尽力提供更详细的建议。
import pandas as pd
# 将中文rc文件转为txt文件
with open('中文rc文件.rc', 'r', encoding='utf-16') as a:
lines = a.readlines()
with open('中文rc文件.txt', 'w', encoding='utf-8') as b:
b.writelines(lines)
# 将外文rc文件转为txt文件
with open('外文rc文件.rc', 'r', encoding='utf-16') as a:
lines = a.readlines()
with open('外文rc文件.txt', 'w', encoding='utf-8') as b:
b.writelines(lines)
# 将中文rc文件的每行数据写入到一个表格excel1
df1 = pd.read_csv('中文rc文件.txt', header=None, names=['中文'], encoding='utf-8')
df1['中文'] = df1['中文'].str.strip()
df1.to_excel('excel1.xlsx', index=False)
# 将外文rc文件每行数据写入到另一个表格excel2
df2 = pd.read_csv('外文rc文件.txt', header=None, names=['外文'], encoding='utf-8')
df2['外文'] = df2['外文'].str.strip()
df2.to_excel('excel2.xlsx', index=False)
# 将excel1和excel2合并为excel3
df3 = pd.merge(df1, df2, left_index=True, right_index=True)
df3.to_excel('excel3.xlsx', index=False)
# 读取excel3
df3 = pd.read_excel('excel3.xlsx')
# 去除相同的内容
df3 = df3.drop_duplicates()
# 在excel3中搜索中文,并获取翻译后的俄语
def translate(chinese):
return russian
df3['俄语'] = df3['中文'].apply(translate)
# 在excel2中搜索俄语,查看是否存在
df2 = pd.read_excel('excel2.xlsx')
df3['是否存在'] = df3['俄语'].isin(df2['外文'])
# 若不存在,记录在新表格中
df4 = df3[~df3['是否存在']]
df4 = df4[['中文']]
df4.to_excel('不存在的中文.xlsx', index=False)
import os
import xlrd
# 存放匹配到的目标文件路径
result = []
# 遍历目录下的所有文件
def file(file_dir):
# os.walk()函数能够获取所有文件及目录名称
# root:本级根目录名称
# dirs:本级目录下子目录名称
# files:本级目录下的文件名称
for root, dirs, files in os.walk(file_dir):
print('A:',root)
print('B:',dirs)
print("C:",files)
# 遍历本级目录下的所有文件
for x in files:
# 匹配文件名称是否包含 .xls 字符(判断是否为xls或xlsx格式文件)
if ('.xls' in x):
# 剔除文件名包含'$'字符的文件
if('$' in x):
print("这文件不需要查询!!==", x)
else:
# 开启查询函数
# 当前根目录与当前文件名需要加'\'合成实际文件路径
search_xlsx(root+'\\'+x)
print('查询完毕!!!')
# xls、xlsx查询函数
def search_xlsx(file):
# 打开工作表
book = xlrd.open_workbook(file)
# 遍历所有工作簿名称
sheetname = book.sheet_names()
# 搜索每个工作簿是否有目标字符
for z in sheetname:
# 打开工作簿,按工作簿名称打开
table = book.sheet_by_name(z)
# 获取工作簿总行数
nrows = table.nrows
# 获取工作簿总列数
ncols = table.ncols
# 遍历每个单元格
for i in range(nrows):
for j in range(ncols):
# 获取单元格内容
value = table.cell(i,j).value
# 需要匹配搜索的内容(注意Excel有文本格式与数字格式的区别
# 例如 123 与 '123' 在excle表里都显示为123)
if value == '9031704021000431':
print ('就是这个表', file)
result.append(file)
if __name__ == '__main__':
# 需要查询的目标文件目录名称
file('E:\\工作汇总\\工作文件\\批次号')
print("目标文件路径为:", result)
引用 皆我百晓生 小程序回复内容作答:
你可以使用Python的pandas库来进行Excel文件的读写和数据处理。以下是一种可能的思路和示例代码:
import pandas as pd
df1 = pd.read_excel('excel1.xlsx')
df2 = pd.read_excel('excel2.xlsx')
df_merged = pd.concat([df1, df2], axis=1) # 按列合并
df3 = pd.read_excel('excel3.xlsx')
df_result = pd.DataFrame(columns=['中文', '外文']) # 创建一个空的DataFrame
for index, row in df1.iterrows():
cn_text = row['中文']
matching_rows = df3[df3['中文'].str.contains(cn_text)]
df_result = pd.concat([df_result, matching_rows[['中文', '外文']]])
for index, row in df_result.iterrows():
en_text = row['外文']
matching_rows = df2[df2['外文'].str.contains(en_text)]
if matching_rows.empty:
# 处理不存在的情况,例如将不存在的中文记录保存到另一个Excel文件中
pass
else:
# 处理存在的情况
pass
以上是一个大致的思路和示例代码,你可以根据具体情况进行修改和完善。另外,请确保安装了pandas库,并替换示例代码中的文件路径为实际的文件路径。
参考结合AI智能、文心一言等综合回答,若有帮助,恭请采纳。
您可以使用Python中的pandas库来查询多个Excel文件。首先,您需要安装pandas库。可以使用以下命令进行安装:
pip install pandas
然后,您可以使用pandas的read_excel函数读取每个Excel文件。您可以将每个Excel文件的数据存储在一个pandas DataFrame对象中。然后,您可以使用pandas的merge函数将所有DataFrame对象合并为一个DataFrame对象。
下面是一个示例代码:
import pandas as pd
# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')
# 将两个DataFrame对象合并为一个
merged_df = pd.merge(df1, df2, on='id')
# 显示合并后的结果
print(merged_df)
在这个示例中,我们假设每个Excel文件都有一个包含id的列,我们使用该列来合并两个DataFrame对象。您可以根据您的数据进行调整。
您可以使用循环来读取多个Excel文件,并使用pandas的concat函数将它们合并为一个DataFrame对象。
希望这可以帮助您解决问题!
可以使用Python的一些库,比如pandas来处理数据,openpyxl来操作Excel文件。
import pandas as pd
from openpyxl import load_workbook
读取Excel文件:
python
# 读取中文Excel文件
df1 = pd.read_excel('excel1.xlsx')
# 读取外文Excel文件
df2 = pd.read_excel('excel2.xlsx')
合并两个数据框:
python
# 将两个数据框合并为一个,假设他们的列名分别为'Chinese'和'Foreign'
df = pd.concat([df1, df2])
根据中文行进行搜索和验证:
python
# 将中文RC文件的内容转换为DataFrame,方便进行搜索
rc_text = pd.read_excel('rc_file.xlsx') # 假设RC文件的内容在第一列
# 在df中根据中文行进行搜索
result = df[df['Chinese'].isin(rc_text['Chinese'])]
参考gpt
对于你的需求,以下是一种可能的思路:
读取excel1和excel2表格数据:使用Python中的第三方库,如pandas
,可以方便地读取excel文件中的数据。你可以使用pandas
库的read_excel
函数来读取excel1和excel2表格数据,并将其存储为两个DataFrame对象。
合并两个表格:使用pandas
库的concat
函数,将excel1和excel2的数据按列合并为一个新的DataFrame对象。这样,你就得到了一个包含中文和外文对应行的表格。
进行比对:遍历excel3中的每一行,获取中文文本。然后,使用pandas
库的str.contains
函数,在合并后的表格中搜索对应的中文文本,判断是否存在。
获取翻译后的俄语:如果中文文本存在于合并后的表格中,可以使用pandas
库的loc
函数,结合条件查询,获取对应的俄语翻译。
检查俄语翻译是否存在于excel2表格中:使用pandas
库的str.contains
函数,在excel2表格的俄语列中搜索俄语翻译,判断是否存在。
记录不存在的中文文本:将不存在的中文文本记录在一个新的excel3表格中,可以使用pandas
库的to_excel
函数将数据保存为Excel文件。
这只是一种基本的思路,你可以根据实际情况进行调整和优化。同时,你可能需要了解pandas
库的基本用法,以及如何使用条件查询和数据操作。
使用 Pandas 的 read_excel 方法来加载 Excel 文件数据,并将其转换为 DataFrame。
excel1_data = pd.read_excel('path_to_excel1_file.xlsx')
excel2_data = pd.read_excel('path_to_excel2_file.xlsx')
excel3_data = pd.read_excel('path_to_excel3_file.xlsx')