


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、幀和加窗的概念1.短時(shí)分析將語(yǔ)音流分為一段一段來(lái)處理,每一段稱為一“幀”;2.幀長(zhǎng):1030ms,20ms常見(jiàn);(幀率)幀移:01/2幀長(zhǎng),幀與幀之間的平滑過(guò)度;3.為了減少語(yǔ)音幀的截?cái)嘈?yīng),需要加窗處理;將具有不連續(xù)點(diǎn)的周期函數(shù)(如矩形脈沖)進(jìn)行傅立葉級(jí)數(shù)展開(kāi)后,選取有限項(xiàng)進(jìn)行合成。當(dāng)選取的項(xiàng)數(shù)越多,在所合成的波形中出現(xiàn)的峰起越靠近原信號(hào)的不連續(xù)點(diǎn)。當(dāng)選取的項(xiàng)數(shù)很大時(shí),該峰起值趨于一個(gè)常數(shù),大約等于總跳變值的9%。這種現(xiàn)象稱為截?cái)嘈?yīng),又叫吉布斯效應(yīng)。矩形窗、Hamming、Hann等窗函數(shù)及其比較三種窗函數(shù)都有低通特性,通過(guò)分析三種窗的頻率響應(yīng)幅度特性可以發(fā)現(xiàn):矩形窗的主瓣寬度最小,旁瓣高
2、度最高,會(huì)導(dǎo)致泄露現(xiàn)象,漢明窗的主瓣最寬,旁瓣高度最低,可以有效的克服泄露現(xiàn)象,具有更平滑的低通特性,應(yīng)用更廣泛。短時(shí)平均能量的主要用途(1)可以從語(yǔ)音中區(qū)別濁音來(lái),因?yàn)闈嵋魰r(shí)短時(shí)平均能量的值要比清音時(shí)短時(shí)平均能量的值大很多;(2)可以用來(lái)區(qū)別聲母和韻母的分界、無(wú)聲和有聲的分界等。短時(shí)過(guò)零率短時(shí)過(guò)零率可以看作信號(hào)頻率的簡(jiǎn)單度量(1)過(guò)零就是指信號(hào)通過(guò)零值。過(guò)零率就是每秒內(nèi)信號(hào)值通過(guò)零值得次數(shù)。(2)對(duì)于離散時(shí)間序列,過(guò)零則是指序列取樣值改變符號(hào),過(guò)零率則是每個(gè)樣本的改變符號(hào)的次數(shù)。對(duì)于語(yǔ)音信號(hào),則是指在一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)??梢杂孟噜弮蓚€(gè)取樣改變符號(hào)的次數(shù)來(lái)計(jì)算。應(yīng)用
3、于語(yǔ)音信號(hào)分析中(1)發(fā)濁音時(shí),聲帶振動(dòng),因而聲門激勵(lì)是以此音調(diào)頻率為基頻來(lái)使聲道共振;盡管有若干個(gè)共振峰,但其能量的分布集中于低于3KHz的頻率范圍內(nèi)。(2)發(fā)清音時(shí)聲帶不振動(dòng),聲道某部分阻塞產(chǎn)生類白噪聲激勵(lì),通過(guò)聲道后其能量集中在比濁音時(shí)更高的頻率范圍內(nèi)。(3)濁音時(shí)能量集中于較低頻率段內(nèi),具有較低的過(guò)零率,而清音時(shí)能量集中于較高頻率段內(nèi),具有較高的過(guò)零率。(4)短時(shí)平均能量和短時(shí)平均過(guò)零率兩個(gè)參數(shù),也都可以用于語(yǔ)音識(shí)別中。主要用于識(shí)別無(wú)聲段和語(yǔ)音段的起點(diǎn)和終點(diǎn)的位置。(5)在背景噪聲比較小的時(shí)候用平均能量來(lái)識(shí)別比較有效,在背景噪聲比較大的時(shí)候用平均過(guò)零率來(lái)識(shí)別比較有效,但是通常情況是兩個(gè)
4、參數(shù)聯(lián)合進(jìn)行識(shí)別。濁音、清音、無(wú)聲的短時(shí)特性S(無(wú)聲)U(清音)V(濁音)三種情況下短時(shí)平均幅度條件概率密度的示意圖??梢钥闯觯瑵嵋舻亩虝r(shí)平均幅度最大,無(wú)聲的短時(shí)平均幅度最小。清音的短時(shí)過(guò)零率最大,無(wú)聲居中,濁音的短時(shí)過(guò)零率最小。語(yǔ)音信號(hào)短時(shí)能量和過(guò)零率的特征 語(yǔ)音一般分為無(wú)聲段,清音段和濁音段。一般把濁音認(rèn)為是一個(gè)以基音周期為周期的斜三角脈沖串,把清音模擬成隨機(jī)白噪聲。由于語(yǔ)音信號(hào)是一個(gè)非平穩(wěn)態(tài)過(guò)程,不能用處理平穩(wěn)信號(hào)的信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但由于語(yǔ)音信號(hào)本身的特點(diǎn),在1030ms的短時(shí)間范圍內(nèi),其特性可以看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過(guò)程,即具有短時(shí)性,因此采用短時(shí)能量和過(guò)零率來(lái)對(duì)語(yǔ)音進(jìn)行端點(diǎn)檢
5、測(cè)是可行的。語(yǔ)音和噪聲的區(qū)別可以體現(xiàn)在他們的能量上,語(yǔ)音段的能量比噪聲段的能量大,如果環(huán)境噪聲和系統(tǒng)輸入的噪聲比較小,只要計(jì)算輸入信號(hào)的短時(shí)能量就能夠把語(yǔ)音段和噪聲背景區(qū)分開(kāi),除此之外,用基于能量的算法來(lái)檢測(cè)濁音通常效果也是比較理想的,因?yàn)闈嵋舻哪芰恐当惹逡舸蟮枚?,可以判斷濁音和清音之間過(guò)渡的時(shí)刻3,但對(duì)清音來(lái)說(shuō),效果不是很好,因此還需要借助短時(shí)過(guò)零率來(lái)表征。短時(shí)能量可以近似為互補(bǔ)的情況,短時(shí)能量大的地方過(guò)零率小,短時(shí)能量小的地方過(guò)零率較大。基于短時(shí)能量和過(guò)零率的檢測(cè)方法 盡管基于短時(shí)能量和過(guò)零率的檢測(cè)方法各有其優(yōu)缺點(diǎn),但是若將這兩種基本方法相結(jié)合起來(lái)使用也可以實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)可靠的端
6、點(diǎn)檢測(cè)。無(wú)聲段的短時(shí)能量為零,清音段的短時(shí)能量又比濁音段的短時(shí)能量大,而在過(guò)零率方面,理想的情況是無(wú)聲段的過(guò)零率為零,濁音段的過(guò)零率比清音段的過(guò)零率要大的多,因此,假設(shè)有一段語(yǔ)音,如果某部分短時(shí)能量和過(guò)零率都為零或者為很小的值,就可以認(rèn)為這部分為無(wú)聲段,如果該部分語(yǔ)音短時(shí)能量很大但是過(guò)零率很小,則認(rèn)為該部分語(yǔ)音為濁音段,如果該部分短時(shí)能量很小但是過(guò)零率很大,則認(rèn)為該部分語(yǔ)音為清音段。正如前面提到,語(yǔ)音信號(hào)具有短時(shí)性,因此在對(duì)語(yǔ)音信號(hào)進(jìn)行分析時(shí),需要將語(yǔ)音信號(hào)以30ms為一段分為若干幀來(lái)進(jìn)行分析,則兩幀起始點(diǎn)之間的間隔為10ms。為防止誤判以及無(wú)聲段過(guò)零率太大,設(shè)tmp1和tmp2為相鄰兩個(gè)采樣
7、點(diǎn),則同時(shí)滿足tmp1*tmp2<0和tmp1-tmp2的絕對(duì)值大于delta時(shí)才算一次過(guò)零,除此之外,為短時(shí)能量和過(guò)零率分別確定兩個(gè)門限,一個(gè)是較低的門限和,其數(shù)值較小,對(duì)信號(hào)的變化比較敏感,很容易就會(huì)被超過(guò)。另一個(gè)是較高的門限和,數(shù)值較大,信號(hào)必須達(dá)到一定的強(qiáng)度,該門限才可能被超過(guò)。低門限被超過(guò)有可能是時(shí)間很短的噪聲引起的,高門限被超過(guò)則可以基本確定是由語(yǔ)音信號(hào)引起的,如圖3所示。短時(shí)能量分析是通過(guò)能量的高低來(lái)區(qū)分清音和濁音,不容易確定語(yǔ)音信號(hào)片段的起始點(diǎn);而過(guò)零率分析僅僅是表明清音的過(guò)零率高于濁音,對(duì)噪聲的存在比較敏感,如果背景中有反復(fù)穿越坐標(biāo)軸的隨機(jī)噪聲,會(huì)產(chǎn)生大量的虛假過(guò)零率,影響檢測(cè)結(jié)果。對(duì)于背景噪聲和清音的區(qū)分則顯得無(wú)能為力。將這兩種方法結(jié)合起來(lái),通過(guò)短時(shí)能量分析
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 美團(tuán)外賣商家訂單分成合同
- 直播活動(dòng)內(nèi)容補(bǔ)充與品牌合作協(xié)議
- 軟性材料研發(fā)與市場(chǎng)推廣合伙協(xié)議
- 網(wǎng)絡(luò)文學(xué)有聲書制作與環(huán)保公益活動(dòng)合作協(xié)議
- 影視作品版權(quán)購(gòu)買與版權(quán)收益分成合同
- 頂級(jí)域名所有權(quán)及商業(yè)價(jià)值轉(zhuǎn)讓服務(wù)合同
- 影視特效動(dòng)作捕捉系統(tǒng)全面解決方案租賃協(xié)議
- 生物樣本冷鏈物流與生命科學(xué)研究支持合同
- 小產(chǎn)權(quán)房配套設(shè)施共享及社區(qū)公共設(shè)施保養(yǎng)維護(hù)合同
- 電商侵權(quán)案件管轄權(quán)爭(zhēng)議補(bǔ)充協(xié)議
- 網(wǎng)絡(luò)與信息安全管理員考試題+參考答案解析
- 《故宮公開(kāi)課》課件
- 《智能家居系統(tǒng)介紹》課件
- 2025-2030年中國(guó)證券融資融券市場(chǎng)需求態(tài)勢(shì)及投資風(fēng)險(xiǎn)預(yù)測(cè)研究報(bào)告
- 淘寶運(yùn)營(yíng)考試試題及答案
- 急性腦梗塞患者護(hù)理查房
- 2025年河南鄭州航空港科創(chuàng)投資集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 騰訊學(xué)院培訓(xùn)課件
- 認(rèn)知增強(qiáng)技術(shù)在法律領(lǐng)域的應(yīng)用-全面剖析
- 化學(xué)自制米酒 領(lǐng)略我國(guó)傳統(tǒng)釀造工藝的魅力課件 2024-2025學(xué)年高一下魯科版(2019)必修第二冊(cè)
- 貴州省往年氣象局筆試公共基礎(chǔ)題庫(kù)
評(píng)論
0/150
提交評(píng)論