训练用户行为,进行预测模型。这应该是一个分类任务,但是一共有2992个类
商品有2000种分类,可以分类两个大类单品与整体。每个商品标签为【0,486,316】 第二个标签有187种,第三个标签有16种。所以一共有2992种分类的商品,第一个标签表示单品还是整体,它是这两千种分类的大分类,意思就是这2992种商品要么是0,要么是1。举例说明:【0,327,316】,【0,328,316】,【1,456,318】
用户的行为可以表示为对上面的商品进行循序浏览,比例【1,456,319】-【1,458,320】-【0,2525,321】,最后用户有一个下载历史 【1,2530,317】
请问这样用什么样的模型进行训练,然后预测。数据应该怎么进行处理。
这个属于二分类的问题,建议采用BP神经网络、支持向量机、感知机等都是可以做的
可以参考:数据预处理与模型训练技巧https://blog.csdn.net/qq_35054151/article/details/121989462
2992个类直接用分类是不合理的,可以参考yolo9000的wordtree设计(可以识别9000个类别的数据),大类里面套小类