怎么把变速后的音频输出保存让我听见,现在只能对比修改前后的波形图,如何添加代码实现这个功能
%实验要求一:语音信号变速实验
clear all; clc; close all;
[xx,fs]=audioread('C7_4_y.wav'); % 读取文件
xx=xx-mean(xx); % 去除直流分量
x=xx/max(abs(xx)); % 归一化
N=length(x); % 数据长度
time=(0:N-1)/fs; % 信号的时间刻度
wlen=240; % 帧长
inc=80; % 帧移
overlap=wlen-inc; % 重叠长度
tempr1=(0:overlap-1)'/overlap; % 斜三角窗函数w1
tempr2=(overlap-1:-1:0)'/overlap; % 斜三角窗函数w2
n2=1:wlen/2+1; % 正频率的下标值
X=enframe(x,wlen,inc)'; % 分帧
fn=size(X,2); % 帧数
T1=0.1; r2=0.5; % 端点检测参数
miniL=10; % 有话段最短帧数
mnlong=5; % 元音主体最短帧数
ThrC=[10 15]; % 阈值
p=12; % LPC阶次
frameTime=FrameTimeC(fn,wlen,inc,fs); % 计算每帧的时间刻度
in=input('请输入伸缩语音的时间长度是原语音时间长度的倍数:','s');%输入伸缩长度比例
rate=str2num(in);
for i=1 : fn % 求取每帧的预测系数和增益
u=X(:,i);
[ar,g]=lpc(u,p);
AR_coeff(:,i)=ar;
Gain(i)=g;
end
% 基音检测
[voiceseg,vosl,SF,Ef,period]=pitch_Ceps(x,wlen,inc,T1,fs); %基于倒谱法的基音周期检测
Dpitch=pitfilterm1(period,voiceseg,vosl); % 对T0进行平滑处理求出基音周期T0
tal=0; % 初始化
zint=zeros(p,1);
%% LSP参数的提取
for i=1 : fn
a2=AR_coeff(:,i); % 取来本帧的预测系数
lsf=lpctolsf(a2); % 调用ar2lsf函数求出lsf
Glsf(:,i)=lsf; % 把lsf存储在Glsf数组中
end
% 通过内插把相应数组缩短或伸长
fn1=floor(rate*fn); % 设置新的总帧数fn1
Glsfm=interp1((1:fn),Glsf',linspace(1,fn,fn1))';% 把LSF系数内插
Dpitchm=interp1(1:fn,Dpitch,linspace(1,fn,fn1));% 把基音周期内插
Gm=interp1((1:fn),Gain,linspace(1,fn,fn1));%把增益系数内插
SFm=interp1((1:fn),SF,linspace(1,fn,fn1)); %把SF系数内插
%% 语音合成
for i=1:fn1;
lsf=Glsfm(:,i); % 获取本帧的lsf参数
ai=lsftolpc(lsf); % 调用lsf2ar函数把lsf转换成预测系数ar
sigma=sqrt(Gm(i));
if SFm(i)==0 % 无话帧
excitation=randn(wlen,1); % 产生白噪声
[synt_frame,zint]=filter(sigma,ai,excitation,zint);
else % 有话帧
PT=round(Dpitchm(i)); % 取周期值
exc_syn1 =zeros(wlen+tal,1); % 初始化脉冲发生区
exc_syn1(mod(1:tal+wlen,PT)==0)=1;% 在基音周期的位置产生脉冲,幅值为1
exc_syn2=exc_syn1(tal+1:tal+inc); % 计算帧移inc区间内的脉冲个数
index=find(exc_syn2==1);
excitation=exc_syn1(tal+1:tal+wlen);% 这一帧的激励脉冲源
if isempty(index) % 帧移inc区间内没有脉冲
tal=tal+inc; % 计算下一帧的前导零点
else % 帧移inc区间内有脉冲
eal=length(index); % 计算有几个脉冲
tal=inc-index(eal); % 计算下一帧的前导零点
end
gain=sigma/sqrt(1/PT); % 增益
[synt_frame,zint]=filter(gain,ai,excitation,zint);%用激励脉冲合成语音
end
if i==1 % 若为第1帧
output=synt_frame; % 不需要重叠相加,保留合成数据
else
M=length(output); % 重叠部分的处理
output=[output(1:M-overlap); output(M-overlap+1:M).*tempr1+...
synt_frame(1:overlap).*tempr2; synt_frame(overlap+1:wlen)];
end
end
output(find(isnan(output)))=0;
bn=[0.964775 -3.858862 5.788174 -3.858862 0.964775]; % 滤波器系数
an=[1.000000 -3.928040 5.786934 -3.789685 0.930791];
output=filter(bn,an,output); % 高通滤波
output=output/max(abs(output)); % 幅值归一化
%% 作图
% figure(1)
ol=length(output); % 输出数据长度
time1=(0:ol-1)/fs; % 求出输出序列的时间序列
subplot 211; plot(time,x,'k'); title('原始语音波形');
axis([0 max(time) -1 1]); xlabel('时间/s'); ylabel('幅值')
subplot 212; plot(time1,output,'k'); title('合成语音波形');
xlim([0 max(time1)]); xlabel('时间/s'); ylabel('幅值')
使用Matlab的 audiowrite保存声音文件。
对不同的数据类型使用不同的规范化。写16位音频wav文件,则应将数据标准化为[-32768,32767]范围,然后将数据转换为int16类型:
y_normalized = intmax('int16') * y/(max(abs(y))*1.001);
audiowrite(filename, int16(y_normalized), fs)
对于float,您应该将数据标准化为[-1,+1]范围:
y_normalized = y/(max(abs(y)));
audiowrite(filename, y_normalized, fs)