有关梯度下降法的一个小疑问

为什么在算法中更新参数的时候学习率后面是乘以该参数在当前位置的偏导数值，而不是乘以梯度的方向余弦值，各参数延梯度的实际变化应该是乘以梯度的方向余弦，是为了方便计算吗？如下图

在算法中更新参数时，使用学习率乘以该参数在当前位置的偏导数值是因为这个偏导数值反映了当前位置的梯度大小和方向。梯度的方向余弦值只是梯度方向的一个标准化表示，因此在更新参数时，使用偏导数值更能反映当前位置的梯度信息。

此外，使用偏导数值也更方便计算，因为偏导数值可以通过求导得到，而计算梯度的方向余弦值需要进行一些额外的计算。因此，在实际应用中，使用偏导数值更为常见和方便。

不知道你这个问题是否已经解决, 如果还没有解决的话:

帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7619193
这篇博客也不错, 你可以看下求解驾驶时间和等待时间，复现【城市纯电动汽车快速充电设施的布局选址优化模型研究】论文中的排队模型
除此之外, 这篇博客: 机器视觉自动数据标注方法中的（强化）主动学习的加入是将人工核验的过程的工作量再进一步地降低，使网络具有一定的自主决策能力，即网络具有理解自己在数据预测上偏差的能力，可为用户提供标注需求进一步改善网络的输出分布。部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:
您还可以看一下刘建萍老师的人工智能系列课程零基础讲解知识点和实例应用线性回归梯度下降逻辑回归课程中的讲解机器学中会涉及到的有关数学方面的知识储备有哪些小节, 巩固相关知识点

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^