我最近刚开始接触神经网络的学习,不知道接下来我对问题的理解与描述是否清晰准确,求大腿!
感知机作为多层神经网络的基本逻辑判断单元,我们一般选择通过sigmoid函数作为激活函数(《机器学习》,周志华,p98)。
(Q1)这里的激活函数是起到决定y的输出值为0,1的作用吗?
(Q2)那么我们是否可以通过选择放弃使用sigmoid,而直接输出y的激活后的值达到增强下一层判断拟合准确性的目的?
(Q3)我们知道,与或非问题都是线性可分的问题,即我们可以找到一个超平面来对问题进行判断。那么将以激活函数为判断依据的逻辑判断,换为SVM-inspired神经网络,我是否能得到对存在较多离群数据的训练集(离群数据会对自适应学习率算法的影响)有更强的鲁棒性的神经网络?这样的神经网络的性能收益是否超过计算负荷带来的负收益?
暂时能想到的就这么多,机器学习任重道远TAT
激活函数主要是增加一个非线性项,否则所有的拟合曲线都平行了
激活函数不是只有sigmoid,还有relu等比较常用
与或非问题都是线性可分,是的,但是xor不可分
(Q1)是的,激活函数在感知机(Perceptron)中起到决定输出值 y 的作用。Sigmoid函数作为一种常用的激活函数,将输出值限定在0到1之间,可以用于二分类问题,输出值接近0时表示类别为0,输出值接近1时表示类别为1。
(Q2)是的,你可以选择不使用 Sigmoid 激活函数,而直接输出 y 的激活后的值。这样的网络称为线性激活函数的网络,对于特定问题可能有其应用场景。例如,在回归问题中,如果输出值是实数范围的,可以不使用激活函数。
(Q3)SVM-inspired神经网络是一种结合了SVM和神经网络的方法,其目的是增强神经网络对离群数据的鲁棒性。在存在较多离群数据的训练集上,SVM-inspired神经网络可能具有更好的性能,因为SVM本身对离群数据较为鲁棒。这样的网络可以通过更好地学习数据的特征,从而提高分类准确性。
不知道你这个问题是否已经解决, 如果还没有解决的话:问题 1:
Q1: 这里的激活函数是否起到决定 y 的输出值为 0 或 1 的作用呢?
A1: 是的,激活函数起到了决定 y 的输出值为 0 或 1 的作用。在感知机中,通过使用 sigmoid 函数作为激活函数,可以将线性输入映射到一个非线性的范围内,并根据阈值将输出限定为 0 或 1,用于逻辑判断。
Q2: 那么我们是否可以通过选择放弃使用 sigmoid,而直接输出 y 的激活后的值达到增强下一层判断拟合准确性的目的呢?
A2: 是的,在某些情况下可以选择放弃使用 sigmoid 函数。如果下一层的判断逻辑不受限于特定的阈值或非线性范围,可以直接将 y 的激活后的值作为输出,作为下一层的输入。这样可以增强模型的表达能力,使其能够更好地拟合复杂的数据模式。
问题 2:
Q3: 我们知道,与或非问题都是线性可分的问题,即我们可以找到一个超平面来对问题进行判断。那么将以激活函数为判断依据的逻辑判断换为 SVM-inspired 神经网络,是否能得到对存在较多离群数据的训练集(离群数据会对自适应学习率算法的影响)有更强的鲁棒性的神经网络?这样的神经网 络的性能收益是否超过计算负荷带来的负收益?
A3: SVM-inspired 神经网络可以提供更强的鲁棒性,并且在存在较多离群数据的训练集上具有更好的性能。通过使用支持向量机 (SVM) 的思想,神经网络可以通过最大化边界(margin)的方式进行分类和拟合,从而对离群数据更加鲁棒。然而,与传统的神经网络相比,这种方法可能会带来更高的计算负荷,因为在训练过程中需要解决额外的优化问题。性能收益是否超过计算负荷带来的负收益取决于具体的问题和数据集。
综合来说,我们可以根据问题的具体要求和数据特征来选择合适的激活函数和模型结构。在某些情况下,放弃使用 sigmoid 并尝试其他激活函数或模型,例如 SVM-inspired 神经网络,可能会带来更好的结果。但要注意考虑计算负荷与性能收益之间的平衡,以及与训练集中离群数据的处理方式。