对率回归模型和kNN模型相关的问题,求解答!

1、对率回归模型是关于特征x的线性模型吗?为什么?
2、对率回归模型需要对数据做归一化处理吗?为什么?请在实际数据集上验证你的分析和判断。
3、kNN模型需要对数据做归一化处理吗?为什么?请在实际数据集上验证你的分析和判断。
4、思考如何用对率回归模型解决多分类问题,并在二值手写数字识别数据集上进行验证和测试。
5、对于机器学习问题,我们真正关心的是测试集上的精度,因此在训练集上最优不一定在测试集上最优,那么我们应该如何选出在测试集上最优的模型呢?请用对率回归模型和梯度下降方法在实际数据集上验证你的想法。

能回答一个都行,帮一下小菜鸡吧!!

我的个人理解:

  1. 对率回归模型不是线性模型。它是在线性回归模型z=w^Tx+b的基础上,加上了Sigmoid函数,即y=1/(1+e^(-z))。

    img

  2. 对率回归模型需要对数据做归一化。
  3. KNN模型需要对数据做归一化。
  4. 对率回归模型主要是解决二分类问题,如果要解决多分类问题的话,一般是用Softmax回归。
  5. 我目前的做法是加入验证集,将数据集划分为训练集、验证集和测试集。对每一个epoch中训练得到的模型,使用验证集验证其精度,经过多次训练后,最后选择验证集精度最高的那个模型。