首页
编程
java
php
前端
首页
编程
java
php
前端
ONNX模型优化(pytorch导出的)
pytorch的pth训练文件导出的ONNX模型太大了(60多M),想知道原因,能不能优化缩小它!
去除onnx造成的冗余,一些cast/shape等操作,这个可以参考大老师的代码
合并一些操作,比如Conv+BN等操作
onnx量化一下
上面前两个操作只会减少memry,但是不会提升速度。第三个操作会大幅降低mem和提高运行速度。
点击展开全文