对“题名+作者”列进行去重,代码如下
data_new = data.drop_duplicates(subset=['题名+作者'], keep='first', inplace=False),
结果报错:
KeyError: Index(['题名+作者'], dtype='object')
请大神指点
subset=['题名+作者'],应该是subset=['题名','作者']吧,不用加号连接,因为是两列,放在中括号中,就应分别列示(逗号隔开)
https://blog.csdn.net/dzysunshine/article/details/100022994
df.drop_duplicates(subset=['dishji'],keep='last')
直接写明名称,不要用A1代替
在excel里面,'题名+作者'这一列的类型要设置为文本类型。