我现在在做汽车故障码和维修之间的分类,意思就是我输入故障码,输出维修还是不维修。
输入是故障码,故障码虽然是数字,但是他们是有专门的标准来设置的,不是说故障码越大,故障就越严重。输出好说,就是二分类0和1。这种应该怎么对故障码进行处理,然后输入到神经网络中训练?
因为故障码库还没有完全更新,担心如果直接输入训练的话,对后面新出的故障码有很多影响。因为有些故障码数值很接近,但是故障情况却差别很大。
输入不是数字特征,你需要做一次转换,类似与one-hot之类的转成数字特征序列,或者做一次Embedding也可以的