我该如何看懂别人的网络模型

自己之前主要从事服务器相关开发,现在和其他部门合作一些深度网络相关的项目,主要是音频领域的,比如声纹,音频语种,音频生成文字之类的,我能看到对方的代码和模型。我现在想学习这块,具体就是这个模型是什么思路,为什么这样一个模型训练训练就能解决这个问题

感觉通过看对方模型结构也解答不了这个问题。这块有啥建议么

建议先学习一下相关数学知识,这样可以知道为什么要计算这个loss或这个acc为什么要这么算出来。至于说模型为什么起作用,主要还是要看对应的paper来了解当初最原始的基础结构是如何实现的。大部分的工作都是在原始大佬的模型上加了或改了点东西。一路看下来就能快速理解为什么这么做了。另一方面看其他模型也能发现很多的工作都大同小异。如有帮助请采纳

建议从基础学起,先了解各个模型的底层算法,不需要精通,但至少要知道怎样用,是什么原理,实现什么功能等等。如果没基础,一切都是梦里看花

希望对你有帮助,如有帮助,望采纳,谢谢

您的问题已经有小伙伴解答了,请点击【采纳】按钮,采纳帮您提供解决思路的答案,给回答的人一些鼓励哦~~

ps:开通问答VIP,享受5次/月 有问必答服务,了解详情↓↓↓

【电脑端】戳>>>  https://vip.csdn.net/askvip?utm_source=1146287632
【APP 】  戳>>>  https://mall.csdn.net/item/52471?utm_source=1146287632