运行后出来的是直线,跟作者的不一样,请问是错哪儿了了?


'''加窗'''
import numpy as np
import librosa.display  # 导入音频及绘图显示包
import matplotlib.pyplot as plt  # 导入绘图工作的函数集合

# 读取音频文件
# 读取语音文件并绘制波形图
times = librosa.get_duration(filename='D:\\信号与音频\\录音文件\\run.wav.wav')  # 获取音频时长
# 返回音频采样数组及采样率
y, sr = librosa.load('D:\\信号与音频\\录音文件\\run.wav.wav', sr=8000, offset=0.0, duration=None)
# x = np.arange(0, times, 1/sr)  # 时间刻度

# 分帧
def frame(x, lframe, mframe):  # 定义分帧函数
    signal_length = len(x)  # 获取语音信号的长度
    fn = (signal_length-lframe)/mframe  # 分成fn帧
    fn1 = np.ceil(fn)  # 将帧数向上取整,如果是浮点型则加一
    fn1 = int(fn1)  # 将帧数化为整数
    # 求出添加的0的个数
    numfillzero = (fn1*mframe+lframe)-signal_length
    # 生成填充序列
    fillzeros = np.zeros(numfillzero)
    # 填充以后的信号记作fillsignal
    fillsignal = np.concatenate((x,fillzeros))  # concatenate连接两个维度相同的矩阵
    # 对所有帧的时间点进行抽取,得到fn1*lframe长度的矩阵d
    d = np.tile(np.arange(0, lframe), (fn1, 1)) + np.tile(np.arange(0, fn1*mframe, mframe), (lframe, 1)).T
    # 将d转换为矩阵形式(数据类型为int类型)
    d = np.array(d, dtype=np.int32)
    signal = fillsignal[d]
    return(signal, fn1, numfillzero)
lframe = int(sr*0.025)  # 帧长(持续0.025秒)
mframe = int(sr*0.001)  # 帧移
# 函数调用,把采样数组、帧长、帧移等参数传递进函数frame,并返回存储于endframe、fn1、numfillzero中
endframe, fn1, numfillzero = frame(y, lframe, mframe)

# 对第一帧进行加窗
hanwindow = np.hanning(lframe)  # 调用汉明窗,把参数帧长传递进去
signalwindow = endframe[0]*hanwindow  # 第一帧乘以汉明窗
x1 = np.arange(0, lframe, 1)  # 第一帧采样点刻度
x2 = np.arange(0, lframe/sr, 1/sr)  # 第一帧时间刻度
# 显示波形图
plt.figure()
plt.plot(x1, signalwindow)
plt.xlabel('point')  # x轴
plt.ylabel('wave')  # y轴
plt.title('firstflame hanningwindow wave', fontsize=12, color='black')
plt.show()
plt.figure()
plt.plot(x2, signalwindow)
plt.xlabel('times')  # x轴
plt.ylabel('wave')  # y轴
plt.title('firstflame hanningwindow wave', fontsize=12, color='black')
plt.show()

img


这个是我做的

img


这个是作者的

代码里画了两张图,你做的展示的是第一张图,作者做的展示的是第二张图。 你看下你的第二张图是什么样的

img


楼主,红框内的这个值是不是0?

有没有可能是你的音频文件的原因

你是直接复制别人的程序,只改了wav文件路径吗?不懂代码,只能往这方面考虑一下。

分析:
第一种情况是对应的参数没有对,及音频采样率的不同
第二种情况是出现素材源的问题,导入的音源不一样

两个plot都没有绘制音频数据

画图代码没有问题,你print一下x1,x2看看有没有获取数据,应该是没有

多数就是你插入得东西有问题,因为其他得代码都是一样得

请问你找到解决的办法了吗

返回值调用没有成功,考虑三变量赋值和下标对应