在机器学习中经常碰到各种求极值的方法,例如梯度下降算法、牛顿迭代法等,这些知识如何系统地学习?
这些知识属于工程数学原理的内容,具体分支是最优化理论,您可以参考相关教材。一般地,优化问题可以分为无约束优化和有约束优化,您提到的梯度法和牛顿法都属于无约束优化中的梯度类方法,此外无约束优化中还有非梯度类的坐标下降算法等;有约束优化中最著名的是拉格朗日乘子法。
如有帮助请采纳
这好几个地方都会有学到的吧,求极值高数肯定会学,你说的第一个就是高数里面会有求梯度的相关知识,梯度下降法相当于很多的梯度当中选择的最优算法(这里是一般算法设计相关课程讲动态规划的时候也会涉及到梯度下降算法),牛顿迭代法高数必学。
剩下的就是机器学习课程会再讲一遍的,深度学习也会学,线性代数会学对应矩阵格式的求法。如果你们后面这几个都没有将的话,你就只能去学高数了,高数牛顿迭代是肯定会讲的,梯度下降法只会讲梯度怎么求,需要结合最优算法才行