首页
编程
java
php
前端
首页
编程
java
php
前端
transformer-base模型在WMT14en-de数据集上大概要训练多少个epoch?
若要达到和原论文相近的bleu分数要在WMT14en-de数据集上大概要训练多少个epoch?(想要租服务器跑,预算一下)
点击展开全文