神经网络的每一层都做了什么?是一个拟合函数吗?还是很多个拟合函数?
个人理解:从数学的角度,就是拟合函数。 足够深的神经网络可以拟合出几乎任意的函数
以一层为例: 输入n维,输出m维 -- 可以理解成拟合了m个函数 每个函数输入n个变量
最后:建议手撕代码,理解更深刻
在这一阶段,我们应该对数据集有一个很好的了解,并且有完整的训练/验证流程。对于任何的模型,我们都能计算得出我们需要的指标。现在可以开始迭代一个好模型了。一般为两个阶段:首先是使得模型足够强,能够在训练集上过拟合;然后在使用归一化策略,放弃一些训练loss,从而降低验证loss,达到一个平衡。
Tips & Tricks:
看是什么神经网络,CNN,RNN和GNN干的事情和原理基本上都不一致,你也无法说他一定是在拟合函数。其本质是矩阵变换,将特征映射到高纬度或者降低特征维度,最后通过超平面分割,将特征分类的过程。
举个神经网络中常见的还有激活层,池化层,全连接层等,还有一些特殊的层,实现一些特殊的功能,这个要看实际的功能来确定是否在拟合。
用常见的cnn网络举例,卷积层就是提取特征的过程;池化层就是在不改变特征的情况下减少计算量,加快计算速度等方面起作用;而像激活层则是将特征映射到高维的非线性区间进行解释;全连接层对特征进行标记分类。