华为麒麟990上的NPU跑网络如何统计实际算力?

我要在990NPU上跑几个网络比如resnet50,需要统计一下实际算力,不过没有看到华为提供了什么命令,请问有什么工具或者方法可以统计的?

这个可以看官方datasheet,或者根据tpu核数、频率、单位频率浮点速度相乘算出理论上限(峰值算力)。但是因为并行计算很难同时所有的计算单元都利用上,并且模型、算法对利用率影响很大,所以不同程序能达到的平均算力差异很大。