关于标准化的一个疑问?

关于标准化使用的一个疑惑。假设我有m组数据,我的数据有两个特征值x1,x2。我对这两个特征使用标准化,分别计算出x1,x2的均值以及最大值,最小值。然后让每个特征减去均值除以最大值与最小值差,然后对数据进行训练,学习得到参数theta。现在想用theta预测一组新的数据(a1,b1)。那怎么对a1,b1进行标准化呢?是计算出m+1组数据的均值和最大最小值,然后标准化吗?还是直接用m组训练集的数据就行?

如果你只需要预测一组新的数据其实怎么样都行,关系不大。如果你要预测很多组数据,是需要将当前的数据和训练集一同归一化的,也就是你说的“计算出m+n(n >= 1)组数据的均值和最大最小值,然后标准化”。