目标:对音频进行二分类CNN的输入可以是图片,channel=3,即三通道。那mfcc.shape=(196,13)是什么意思啊,是指这个mfcc是2维吗?可是我看有些资料写的mfcc求出来是13维啊。如果mfcc这个矩阵是二维的,那么channel=1,通道数是1。如果mfcc这个矩阵是13维的,那该怎么处理呢?