题干: 头条问答数据(包括用户及其标签、问题(item, 项目)及其标签以及用户-项目回答(交互)记录)
比如: user.info: 用户 id, 用户标签
item.info: 项目 id, 项目标签
interaction.txt: 用户 id 项目 id , 如 1 4 表示 用户 1 与项目 4 有过交互记录,即用户 1 回答过问题 4。
User.info 用于建立用户之间的关系
Item.info 用于建立项目之间的关系 Interaction.txt 用于创建训练集和测试集
要求实现的功能:1. 数据读取及预处理:读取 interaction.txt 数据,对数据进行切分,随机选择 80%的数据作为训练集,剩余的 20%的数据作为测试集。
2. 模拟生成,将自己作为最后一个用户,模拟生成自己的 100 条行为数据并添加到训练集当中。 3. 保存训练集的数据到文件 1 中,测试集的数据到文件 2 中。保存格式:根据实际需要合理保存。
4. 读取文件 1 中的数据,作为用户的历史行为数据
你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,目前超出我们的服务范围,暂时无法为您解答。
首次提问人员可免费体验一次有问必答服务。目前首次提问的问题服务范围为:编程语言、Java开发、python、数据库、前端开发 领域专业技术问题,为您提供问题的解决思路和指导。不提供源码代写、项目文档代写、论文代写、作业代写、安装包资源发送或安装、软件使用指导等服务。
我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。