1.为什么输入SVM分类器用4096维的特征,不用pool5中的特征向量。毕竟难道不是卷积层得出图像的特征,后面全连接是用来分类吗?2.bb regression中,输入是pool5的向量,也就是输入的size是6x6x256?3.pre-training和fine-tuning是用softmax+交叉熵训练吗?