都说要求建模前,需对连续型数据进行标准化处理,对分类型数据进行独热编码处理。
请问下,是否分类模型、回归模型,均需要对这些特征量进行处理?
对于特征的处理, 无论是连续型数据的标准化处理还是category数据的encoding 都是便于模型的学习和训练.这个操作是普遍使用于大多数模型的, 无论是分类模型还是回归模型.当然,有些模型对于这些处理不是特别敏感,并不能显著提升模型的performance,这时候 也是可以不做的.
如果对于模型原理不熟, 没有办法判定是不是对于这些处理敏感还是不敏感, 一般可以同时训练两种情况并对比他们的performance, 大概就能有个了解了.