关于对率回归、病马预测数据集的问题

1-1、请推导对率回归的解析解,并在实际数据集上验证。
1-2、基于1-1,请在“病马预测数据集”上比较对率回归的解析解和梯度下降的解,谁的训练误差最低,谁的测试误差最低。
1-3、基于1-2,请思考:对率回归的解析解一定是我们在机器学习任务上期望得到的最优解吗?为什么?
1-4、关于对率回归的求解,梯度下降和解析解相比有什么特点和优势,为什么?
1-5、关于对率回归,如果没有偏置项会有什么影响?为什么?请在实际数据集上验证你的分析和判断。
1-6、用梯度下降求解对率回归模型的过程中,参数的初值我们是如何设置的呢?可以设置为其它值吗?为什么?请在实际数据集上验证你的分析和判断。
1-7、用梯度下降求解对率回归模型的过程中,学习率我们是如何设置的呢?为什么这么设置呢?能够搜索到最佳学习率吗?请在实际数据集上验证你的分析和判断。
1-8、用随机梯度下降求解对率回归模型的过程中,“小batch”的大小和一遍(epoch)迭代的抽样次数我们应该如何设定?请在实际数据集上尝试设置不同的“小batch”大小,并对结果进行比较。

能回答其中一个问题都可以,求巨佬解答!!

感谢关注!我就说一下1-7问题的一些见解:一般来说学习率会设置在0.001到0.00005之间,设置的小是因为防止在反向传播的时候在最优点的左右震荡。搜索最佳学习率的话可以参考一种简略的方式就是你可以假设经过多少个epoch,你就以什么方式来更新一次学习率,然后比较效果。