问题是这个函数会把某列符合条件的这一行都给删掉了,我只删去这一列的重复值,但是保留其他列的重复值。
就是本来是很多个一样的数对应很多数,我想变成一对多。
那你啥意思?某列出现重复值,把它挖空吗?
dataFrame是个矩阵形式,该函数是用来根据某一个列或多个列来去除重复的。
你的需求不是很明白,但应该需要其它方法,而不是纠结该函数
你的这个需求适合使用datafram的groupby('E')方法,
drop_duplicate方法实现不来你想要的结果
你的意思我大概明白,解决办法
方法1:如何你必须要用python,那你应将execl数据以标准的形式
方法2:
你直接在python中调用execl处理模块进行处理,你必须熟悉excel VBA相关函数(脚本语言,通过宏执行)
方法3:
你直接应用excel VBA函数(脚本语言,通过宏执行)处理数据
如果数据量较小用VBA还可用,如数据量大如10000行,VBA效率比较低
你的这个问题牵扯到数据预处理,说白点就是处理excel数据,要想灵活处理,必须熟练VBA,学习周期还是漫长的,对于会python的,花费这么大代价无多大意义。
之前我用excel VBA处理期货数据,效率低,有时要几分钟,当然是1-10万行数据,最后用mysql+python处理
不知你的具体细节,自己看吧
另外上面老兄回答的比较好