




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、視頻語音處理技術倒譜計算與分析學院名稱: 計算機與信息工程學院 專業(yè)名稱: 計算機科學與技術 年級班級: 姓 名: 學 號: 計算機與信息技術學院綜合性、設計性實驗報告專業(yè):計算機科學技術 年級/班級:2011級 20122013學年第一學期課程名稱視頻語音處理技術指導教師張新明本組成員學號姓名1108114153 王彥秋實驗地點計科樓324實驗時間項目名稱倒譜計算與分析實驗類型設計性一、 實驗目的:對語音信號進行同態(tài)分析可得到語音信號的倒譜參數(shù)。語音的倒譜是將語音的短時譜取對數(shù)后再進行IDFT得到的,所以濁音信號的激勵反映在倒譜上是同樣周期的沖激,借此,可從倒譜波形中估計出基音周期。對倒譜進
2、行低時窗選,通過語音倒譜分析的最后一級,進行DFT后的輸出即為平滑后的對數(shù)模函數(shù),這個平滑的對數(shù)譜顯示了特定輸入語音段的諧振結構,即譜的峰值基本上對應于共振峰頻率,對于平滑過的對數(shù)譜中的峰值進行定位,即可估計共振峰。對于倒譜計算與分析的設計實驗可作如下訓練: 1、復倒譜的幾種計算方法:2、最小相位信號法和遞歸法;3、基音檢測;4、共振峰檢測。二、實驗儀器或設備:windowsXP下的Matlab編程環(huán)境三、總體設計(設計原理、設計方案及流程等)1復倒譜的幾種計算方法:在復倒譜分析中,z變換后得到的是復數(shù),所以取對數(shù)時要進行復對數(shù)運算。這時存在相位的多值性問題,稱為“相位卷繞”。設信號為 則其傅
3、里葉變換為 對上式取復對數(shù)為則其幅度和相位分別為:上式中,雖然 , 的范圍均在 內,但 的值可能超過 范圍。計算機處理時總相位值只能用其主值 表示,然后把這個相位主值“展開”,得到連續(xù)相位。所以存在下面的情況: (K為整數(shù))此時即產(chǎn)生了相位卷繞。下面介紹幾種避免相位卷繞求復倒譜的方法。最小相位信號法這是解決相位卷繞的一種較好的方法。但它有一個限制條件:被處理的信號想x(n)必須是最小相位信號。實際上許多信號就是最小相位信號,或可以看作是最小相位信號。語音信號的模型就是極點都在z平面單位圓內的全極點模型,或者極零點都在z平面單位圓內的極零點模型。設信號x(n)的z變換為X(z)=N (z)/ D
4、(z) ,則有根據(jù)z變換的微分特性有 若x(n)是最小相位信號,則 必然是穩(wěn)定的因果序列。 由Hilbert變換的性質可知,任一因果復倒譜序列都可分解為偶對稱分量和奇對稱分量之和:其中這兩個分量的傅里葉變換分別為 的傅里葉變換的實部和虛部。 從而可得此即復倒譜的性質3,也就是說一個因果序列可由其偶對稱分量來恢復。如果引入一個輔助因子g(n),上式可寫作其中最小相位信號法求復倒譜原理框圖如下遞歸法這種方法僅限于是最小相位信號的情況。根據(jù)z變換的微分特性得對上式求逆z變換,根據(jù)z變換的微分特性,有所以設x(n)是最小相位序列,而最小相位信號序列一定為因果序列 ,所以有由于 及 可得遞推公式遞歸運算
5、后由復倒譜定義可知如果x(n)是最大相位序列,則變?yōu)槠渲?、基音檢測;語音的倒譜是將語音的短時譜取對數(shù)后再進行IDFT得到的,所以濁音信號的周期性激勵反映在倒譜上是同樣周期的沖激。借此,可從倒譜波形中估計出基音周期。一般把倒譜波形中第二個沖激,認為是對應激勵源的基頻。下面給出一種倒譜法求基音周期的框圖及流程圖如下3.共振峰檢測 倒譜將基音諧波和聲道的頻譜包絡分離開來。對倒譜進行低時窗選,通過語音倒譜分析系統(tǒng)的最后一級,進行DFT后的輸出即為平滑后的對數(shù)模函數(shù),這個平滑的對數(shù)譜顯示了特定輸入語音段的諧振結構,即譜的峰值基本上對應于共振蜂頻率,對平滑過的對數(shù)譜中的峰值進行定位,即可估計共振峰。原理
6、框圖及流程圖如下。四、實驗步驟(包括主要步驟、代碼分析等)1倒譜MATLAB實現(xiàn)代碼段clear all; %倒譜s,fs,nbit=wavread('beijing.wav'); %讀入一段語音b=s' %將s轉置x=b(5000:5399); %取400點語音N=length(x); %讀入語音的長度S=fft(x); %對x進行傅里葉變換Sa=log(abs(S); %log為以e為底的對數(shù)sa=ifft(Sa); %對Sa進行傅里葉逆變換ylen=length(sa); for i=1:ylen/2; sal(i)=sa(ylen/2+1-i);endfor i
7、=(ylen/2+1):ylen; sal(i)=sa(i+1-ylen/2);end%繪圖figure(1);subplot(2,1,1);plot(x);%axis(0,400,-0.5,0.5)title('截取的語音段');xlabel('樣點數(shù)');ylabel('幅度');subplot(2,1,2);time2=-199:1:-1,0:1:200;plot(time2,sa1);%axis(-200,200,-0.5,0.5)title('截取語音的倒譜');xlabel('樣點數(shù)');ylabel(
8、'幅度');運行結果如圖:2. 倒譜法求濁音、清音的基音周期 function s=p5_2pitchdetectwaveFile='beijing.wav'y,fs,nbits=wavread(waveFile);time1=1:length(y);time=(1:length(y)/fs;frameSize=floor(50*fs/1000); % 幀長startIndex=round(5000); % 起始序號endIndex=startIndex+frameSize-1; % 結束序號frame=y(startIndex:endIndex); % 取出該
9、幀frameSize=length(frame);frame2=frame.*hamming(length(frame); % 加漢明窗rwy=rceps(frame2); % 求倒譜ylen=length(rwy);cepstrum=rwy(1:ylen/2);for i=1:ylen/2; cepstrum1(i)=rwy(ylen/2+1-i);endfor i=(ylen/2+1):ylen; cepstrum1(i)=rwy(i+1-ylen/2);end%基因檢測LF=floor(fs/500); %基因周期的范圍是70500HzHF=floor(fs/70);cn=cepstru
10、m(LF:HF);mx_cep ind=max(cn);if mx_cep>0.08&ind>LF; a=fs/(LF+ind);else a=0;endpitch=a%畫圖figure(1);subplot(3,1,1);plot(time1,y);title('語音波形');%axis tightylim=get(gca,'ylim');line(time1(startIndex),time1(startIndex),ylim,'color','r');line(time1(endIndex),time1(
11、endIndex),ylim,'color','r');xlabel('樣點數(shù)');ylabel('幅度');subplot(3,1,2);plot(frame);%axis(0,400,-0.5,0.5)title('一幀語音');xlabel('樣點數(shù)');ylabel('幅度')subplot(3,1,3);time2=-199:1:-1,0:1:200;plot(time2,cepstrum1);%axis(-200,200,-0.5,0.5)title('一幀語音的
12、倒譜');xlabel('樣點數(shù)');ylabel('幅度');運行結果如下圖:倒譜法求濁音的基音周期 清音的倒譜 3. 共振峰檢測程序waveFile='qinghua.wav'y,fs,nbits=wavread(waveFile);time=(1:length(y)/fs;frameSize=floor(40*fs/1000); % 幀長startIndex=round(15000); % 起始序號endIndex=startIndex+frameSize-1; % 結束序號frame=y(startIndex:endIndex);
13、 % 取出該幀frameSize=length(frame); frame2=frame.*hamming(length(frame); %加漢明窗rwy=rceps(frame2); %倒譜求ylen=length(rwy);cepstrum=rwy(1:ylen/2);% 基音檢測LF=floor(fs/500);HF=floor(fs/70);cn=cepstrum(LF:HF);mx_cepind=max(cn);% 找到最大的突起的位置% 共振峰檢測核心代碼NN=ind+LF;ham=hamming(NN);cep=cepstrum(1:NN);ceps=cep.*ham; %漢明窗
14、formant1=20*log(abs(fft(ceps);formant(1:2)=formant1(1:2);for t=3:NN % do some median filtering z=formant1(t-2:t); md=median(z); formant2(t)=md;endfor t=1:NN-1 if t<=2 formant(t)=formant1(t); else formant(t)=formant2(t-1)*0.25+formant2(t)*0.5+formant2(t+1)*0.25; endendsubplot(3,1,1);plot(cepstrum)
15、;title('倒譜');xlabel('樣點數(shù)');ylabel('幅度')%axis(0,220,-0.5,0.5)spectral=20*log(abs(fft(frame2);subplot(3,1,2);xj=(1:length(spectral)/2)*fs/length(spectral);plot(xj,spectral(1:length(spectral)/2);title('頻譜');xlabel('頻率/Hz');ylabel('幅度/dB')%axis(0,500,-100,50)subplot(3,1,3);xi=(1:NN/2)*fs/NN;plot(xi,formant(1:NN/2);title('平滑對數(shù)幅度譜');xlabel('頻率/Hz');ylabel('幅度/dB');%axis(0,550
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位房屋租賃合同書
- 2025西安美術學院輔導員考試試題及答案
- 2025遼寧理工學院輔導員考試試題及答案
- 2025鹽城工業(yè)職業(yè)技術學院輔導員考試試題及答案
- 2025赤峰學院輔導員考試試題及答案
- 2025福建水利電力職業(yè)技術學院輔導員考試試題及答案
- 江蘇蘇州凌曄進出口有限公司招聘筆試題庫2025
- 內蒙古賽一建建筑工程有限公司招聘筆試題庫2025
- 四川綿陽愛聯(lián)科技股份有限公司招聘筆試題庫2025
- 社區(qū)矯正集中教育
- (五調)武漢市2025屆高三年級五月模擬訓練生物試卷(含答案)
- 安全生產(chǎn)月活動查找身邊安全隱患人人講安全個個會應急課件
- 江蘇省啟東市高中數(shù)學 第二章 平面向量 第6課時 2.3.2 向量的坐標表示(1)教案 蘇教版必修4
- 社會主義發(fā)展簡史智慧樹知到課后章節(jié)答案2023年下北方工業(yè)大學
- 用TOC理論提高生產(chǎn)制造的競爭力課件
- SketchUp (草圖大師) 基礎培訓PPT課件
- 生命線安裝方案
- 代理機構服務質量考核評價表
- 電廠保安人員管理制度
- 2018年瀘州市生物中考試題含答案
- ge核磁共振機房專用精密空調機技術要求
評論
0/150
提交評論