SQL怎么实现这个要求?

统计所有用户记录中,用户两两之间购买的相同的产品(category_id),保存格式:(userA_userB category_id1,category_id2,……)

  1. 先出一个去重表,只有两列,user_id和category_id,有记录的表示该用户有购买过该产品,不论次数,假设表名为 a
  2. 自表关联笛卡尔积,取产品相同用户不同的记录
    select a1.user_id userA,a2.user_id userB,a1.category_id from a a1,a a2 where a1.category_id=a2.category_id and a1.user_id<>a2.user_id;
    
  3. 对上面的结果,以userA和userB进行group by ,对category_id进行字符串拼接的聚合,这个聚合函数就得看是用的什么数据库了,不同数据库不一样,比如oracle中可以使用listagg,其他数据库字符串聚合方案如下

img


截图来自https://modern-sql.com/feature/listagg

格式需要自己处理了, 因为有两个以上的人买同样的产品类, 看你需求是笛卡尔积还是怎么用脚本处理吧, sql如下

select category_id, GROUP_CONCAT(DISTINCT user_id) from table group by category_id having count(DISTINCT user_id) >=2

有用记得点个采纳

悬赏一下应该就有答案了

分组 在去重