读取 interaction.txt 数据,随机选择 训练集和测试集的比例为8:2

题干: 头条问答数据(包括用户及其标签、问题(item, 项目)及其标签以及用户-项目回答(交互)记录)

比如: user.info: 用户 id, 用户标签

item.info: 项目 id, 项目标签

interaction.txt: 用户 id 项目 id , 如 1 4 表示 用户 1 与项目 4 有过交互记录,即用户 1 回答过问题 4。

User.info 用于建立用户之间的关系

Item.info 用于建立项目之间的关系 Interaction.txt 用于创建训练集和测试集

要求实现的功能:1. 数据读取及预处理:读取 interaction.txt 数据,对数据进行切分,随机选择 80%的数据作为训练集,剩余的 20%的数据作为测试集。

2. 模拟生成,将自己作为最后一个用户,模拟生成自己的 100 条行为数据并添加到训练集当中。 3. 保存训练集的数据到文件 1 中,测试集的数据到文件 2 中。保存格式:根据实际需要合理保存。

4. 读取文件 1 中的数据,作为用户的历史行为数据

你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,目前超出我们的服务范围,暂时无法为您解答。

首次提问人员可免费体验一次有问必答服务。目前首次提问的问题服务范围为:编程语言、Java开发、python、数据库、前端开发 领域专业技术问题,为您提供问题的解决思路和指导。不提供源码代写、项目文档代写、论文代写、作业代写、安装包资源发送或安装、软件使用指导等服务。

我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。