模型在外部数据验证集的表现好于训练集，是怎么回事？

我开发的logistics回归模型，结局变量为二分类，训练集样本数337个。加强型Bootstrap内部验证计算校正后AUC：0.736，Brier scores：0.202。外部数据验证集样本数92个（处理方案处理地点一致，但来源不一致，训练集为本土患者，验证集为境外患者）。两个数据集结局变量的分布差异无统计学意义。外部验证AUC：0.810，Brier scores：0.176。模型在外部数据验证集的表现好于训练集。这是什么原因？
我自己分析的原因：1、训练集和验证集数据上差异不大；2、验证集样本量较少；3、验证集低风险人群占比更高。
请问我的推断是否正确？谢谢。
图1：内部验证的结果