我想要把这个表格按照酒店名称和入住房型做聚类,去掉评论日期,把评论详情合并到一起。我利用pandas的聚合处理只能算出每个聚类有多少条评论。各位大神有什么方法么?
给你一个示例代码参考一下,结合自己的数据结构和处理要求作进一步调整。
import pandas as pd
df=pd.DataFrame({'hotel':['h1','h1','h3','h2','h3','h1'],'comments':['nice','better services ','not good','wonderful','it\'s ok','friendly people, beautiful place'],'type':['business','single','ordinary','single','business','ordinary']})
df1=df.groupby(['hotel','type'])['comments'].agg(lambda x: '\n'.join(x))
print(df1)
#output:
hotel type
h1 business nice
ordinary friendly people, beautiful place
single better services
h2 single wonderful
h3 business it's ok
ordinary not good
Name: comments, dtype: object
您好,我是有问必答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632
非常感谢您使用有问必答服务,为了后续更快速的帮您解决问题,现诚邀您参与有问必答体验反馈。您的建议将会运用到我们的产品优化中,希望能得到您的支持与协助!
速戳参与调研>>>https://t.csdnimg.cn/Kf0y