机器学习特征值训练遇到的难题

img


这是两个特征值,已经进行热编码,其中一个特征的值是列表,下面是要预测的label,是工资范围。请问应该怎样去训练预测呢?特征值为列表怎样处理,label还需要热编码吗?

img

(1) 特征值是列表,如何构造输入取决于特征值的属性。如果列表中每一项元素有明确的属性,原则上可以展开为 特征向量。
(2)你的问题中列表长度不同,就要搞清楚列表元素到底是什么,才能考虑如何构造输入。
(3)标签是数据范围,可以进行热编码,也可以对每个标签计算中值,作为输出值。