我开发的logistics回归模型,结局变量为二分类,训练集样本数337个。加强型Bootstrap内部验证计算校正后AUC:0.736,Brier scores:0.202。外部数据验证集样本数92个(处理方案处理地点一致,但来源不一致,训练集为本土患者,验证集为境外患者)。两个数据集结局变量的分布差异无统计学意义。外部验证AUC:0.810,Brier scores:0.176。模型在外部数据验证集的表现好于训练集。这是什么原因?
我自己分析的原因:1、训练集和验证集数据上差异不大;2、验证集样本量较少;3、验证集低风险人群占比更高。
请问我的推断是否正确?谢谢。
图1:内部验证的结果