怎么用Python快速提取散落在多个表格中的重复数据

问题是这样的:
有好几个Excel的数据(来自不同文件),需要按照其中一列来看重复的内容,然后提取重复的那一行的数据,产出可能是很多个Excel但是已经把原来散落在各个Excel里的重复信息放在一起整理好的那种 如果可以的话能不能~写一下 第一次接触Python(哭)

可以参考如下操作:

import pandas as pd
import os
df=pd.DataFrame()
#读取文件夹下待处理的所有excel表格
for f in os.listdir('../helpother'):
    if f.endswith('.xlsx'):
        d=pd.read_excel(os.path.join('../helpother',f))
        df=pd.concat([df,d],ignore_index=False)
#选取特定列有重复项
df=df[df.duplicated(subset='name',keep=False)]#保留所有重复行
print(df)

如有帮助,请点采纳。

用python把excel表内容写入数据库不就完了吗?这种代码网上一搜一大堆

只要这样这样,那样那样。什么你都还没学python,那问什么?