各位高手,我用glmnet包来筛选logistics回归的变量,发现同样的代码,多次运行其结果并不完全一致。也就是说,有可能这次运行筛选出来1个变量,下次运行就筛出2个。本质就是lamda.min这个取值在变化。请问各位这是为什么?是我代码有问题还是lasso本身就不是很稳定?谢谢!
他们都回答对了。就是你每次做cv.glmnet的时候,它内部有一个随机分配测试集和验证集的过程,所以会导致你每一次的结果都不一样。所以,你要在运行cv.glmnet前,加上set.seed(任意数字),这个任意数字不改,你的结果就不会变。
lambda的取值一般需要通过交叉检验来确定
可能是我没说清楚,lamda.min的取值都是通过cv.glmnet来确定的。目前问题的本质,其实也就是多次重复运行cv.glmnet,其lamda.min的取值并不是固定的
lambda的取值通过交叉验证确定 交叉验证的集合划分是random 如果想固定取值 可以在cv.glmnet这句前加set.seed()
设置一个种子数,每次结果就一致了