




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、語音信號的壓縮編碼語音信號的壓縮編碼一一.壓縮編碼原因壓縮編碼原因 語音信號的壓縮編碼是研究如何降語音信號的壓縮編碼是研究如何降低語音信號編碼速率的問題。低語音信號編碼速率的問題。 以語音信號為例,模擬形式下帶寬一以語音信號為例,模擬形式下帶寬一般不到般不到4KHz4KHz,經(jīng)過調(diào)制后,所需傳輸帶,經(jīng)過調(diào)制后,所需傳輸帶寬不會超過寬不會超過8KHz8KHz。 但是以但是以8KHz8KHz抽樣,并且每個樣值用抽樣,并且每個樣值用8 8位二進位二進制代碼表示時,即采用制代碼表示時,即采用A A率率1313折線折線PCMPCM數(shù)字語音信數(shù)字語音信號時,信息速率為號時,信息速率為64Kbit/s64K
2、bit/s。利用二進制理想基帶傳輸系統(tǒng)傳輸利用二進制理想基帶傳輸系統(tǒng)傳輸一路這樣的數(shù)字語音信號。所占一路這樣的數(shù)字語音信號。所占系統(tǒng)的最小頻帶寬度為系統(tǒng)的最小頻帶寬度為32KHz32KHz。頻帶利用率頻帶利用率=傳輸速率傳輸速率/帶寬帶寬v二二.什么是語音壓縮編碼?什么是語音壓縮編碼? 把數(shù)碼率低于把數(shù)碼率低于64Kbit/s64Kbit/s的的語音編碼方法稱為語音壓縮編語音編碼方法稱為語音壓縮編碼技術碼技術三三.語音編碼分類語音編碼分類根據(jù)編碼器的實現(xiàn)機理,分成三大類根據(jù)編碼器的實現(xiàn)機理,分成三大類波形編碼波形編碼參數(shù)編碼參數(shù)編碼混合編碼混合編碼1、波形編碼、波形編碼 從語音信號的波形出發(fā),
3、對波形的從語音信號的波形出發(fā),對波形的抽樣值、預測值、預測誤差進行編碼,抽樣值、預測值、預測誤差進行編碼,它以重建語音波形為目的,力圖使重它以重建語音波形為目的,力圖使重建波形接近原信號波形。建波形接近原信號波形。特點:利用抽樣定理,恢復原始信號的波形特點:利用抽樣定理,恢復原始信號的波形 優(yōu)點:優(yōu)點:適應能力強,重建語音質(zhì)量好適應能力強,重建語音質(zhì)量好缺點:缺點:編碼速率較高編碼速率較高類型:類型: PCM, 自適應增量調(diào)制自適應增量調(diào)制 (ADM),), 自適應差分編碼調(diào)制(自適應差分編碼調(diào)制(ADPCM),), 自適應預測編碼自適應預測編碼APC速率通常在速率通常在16-64kbit/s
4、范圍范圍v2.參數(shù)編碼參數(shù)編碼 提取語音的一些特征信息進行編碼,提取語音的一些特征信息進行編碼,在收端利用這些特征參數(shù)合成語音。在收端利用這些特征參數(shù)合成語音。v優(yōu)點:優(yōu)點:編碼速率低。編碼速率低。v缺點:缺點:語音的音質(zhì)和自然度較差,很語音的音質(zhì)和自然度較差,很難辨別說話人。(有一定的可懂度難辨別說話人。(有一定的可懂度)v類型類型:LPC線性預測編碼線性預測編碼速率通常是在速率通常是在4.8kbit/s以下以下3.混合編碼混合編碼v介于波形編碼和參數(shù)編碼的一種編碼。介于波形編碼和參數(shù)編碼的一種編碼。即在參數(shù)編碼的基礎上引入了波形編即在參數(shù)編碼的基礎上引入了波形編碼的一些特征。碼的一些特征。
5、波形編碼波形編碼+參數(shù)編碼參數(shù)編碼可在可在4-16kbit/s范圍內(nèi)達到良好的語范圍內(nèi)達到良好的語音質(zhì)量音質(zhì)量類型:類型:子帶編碼子帶編碼衡量話音編碼器的參數(shù)數(shù)據(jù)輸出速率延遲時間話音質(zhì)量價格(實現(xiàn)代價)語音信號的冗余度幅度非均勻分布樣本之間的相關性周期之間的相關性基音之間的相關性靜止系數(shù)(話音間隙)長期相關性(long term correlation)tnxa(nT)xa(t) 2.采樣: 將時間連續(xù)信號將時間連續(xù)信號變成時間離散信號。變成時間離散信號。 采樣頻率通常為采樣頻率通常為f fs s8kHz8kHz。vIdeal sampling and real sampling 對離散時間信
6、號進行量化,對離散時間信號進行量化,在每一時刻對在每一時刻對x xa a(nT(nT) )獨立進行量化,把給定的幅度連續(xù)的信號變成為有獨立進行量化,把給定的幅度連續(xù)的信號變成為有限多個幅度的集合中某個幅度值的過程。限多個幅度的集合中某個幅度值的過程。3. A/D轉(zhuǎn)換采樣采樣量化量化x xa a(t(t) )x xa a(nT(nT) )x(n)x(n)x xa1a1x x1 1x xk kx xakakx xak+1ak+1x xk+1k+1x xL Lx xaLaLx xaL+1aL+1x(n)=Qxx(n)=Qxa a(nT(nT) 000001010011111110101100 /2/
7、2量化誤差量化誤差( (噪聲噪聲) ) e(n)=x(n)- xe(n)=x(n)- xa a(nT(nT) ) - - /2/2 e(n) e(n) /2/22 m=00 其他其他(1 1)假設量化噪聲是平穩(wěn)的白噪聲過程,有)假設量化噪聲是平穩(wěn)的白噪聲過程,有 Ee(n)e(n+m)=Ee(n)e(n+m)=(2 2)假設量化噪聲與輸入信號不相關,有)假設量化噪聲與輸入信號不相關,有 Ee(n)x(n+m)=0 mEe(n)x(n+m)=0 m為任意值為任意值(3 3)在每個量化間隔上,量化噪聲均勻分布,有)在每個量化間隔上,量化噪聲均勻分布,有 P Pe e(e(n(e(n)=)=1 |e
8、(n)| 1 |e(n)| /2/2 0 其他其他量化信噪比量化信噪比量化噪聲的信噪比:量化噪聲的信噪比:SNR=SNR= x x2 2/ / e e2 2 x x2 2語音信號序列的方差,語音信號序列的方差, e e2 2噪聲序列的方差,噪聲序列的方差, 用分貝表示,用分貝表示,SNR=10log(SNR=10log( x x2 2/ / e e2 2) SNR = signals energy / noises energySNR=6.02B+4.77SNR=6.02B+4.7720log(X20log(Xmaxmax/ / x x) )6.02B6.02B7.277.27 X Xmaxm
9、ax表示其峰值表示其峰值 B B為量化的比特數(shù)為量化的比特數(shù)當語音信號的幅度服從拉普拉斯分布時,當語音信號的幅度服從拉普拉斯分布時,X Xmaxmax4 4 x x 量化器每增加一個比特,量化器每增加一個比特,SNRSNR提高約提高約6dB6dB。當。當B=8,SNR=40dBB=8,SNR=40dB,滿足一般通信系統(tǒng)的要求。當量化,滿足一般通信系統(tǒng)的要求。當量化噪聲的信噪比達到噪聲的信噪比達到 606070dB70dB,才能保障有高水平,才能保障有高水平通話質(zhì)量,這時要求量化為通話質(zhì)量,這時要求量化為 111113bits13bits。一般的。一般的音頻音頻A/DA/D、D/AD/A轉(zhuǎn)換芯片
10、,量化為轉(zhuǎn)換芯片,量化為12bits12bits。脈沖編碼調(diào)制(PCM)Pulse Code ModulationPCM的量化方式均勻量化與非均勻量化非均勻量化對小信號采用小的量化間隔,對大信號采用大的量化間隔,這樣可以用較少的位數(shù)編碼。對大信號來說,雖然絕對量化誤差較大,但是因為:(1)大信號出現(xiàn)的機會不多,(2)信噪比(相對誤差)與小信號是一致的,所以對總的話音質(zhì)量影響不大。非均勻量化也是一種壓縮。律壓擴與A律壓擴m 律(m -Law)壓擴(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中。x為x 為輸入信號,規(guī)格化為1= x =1m 為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間
11、隔之比,取100 = m = 500。律壓擴與A律壓擴0 0 = | |x x| | = 1/A 1/A1/A 1/A = | |x x| | = 1 1A律(A-Law)壓擴(G.711)主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中對于采樣頻率為8 kHz,樣本精度為13位、14位或者16位的輸入信號,使用m 律壓擴編碼或者使用A律壓擴編碼,經(jīng)過PCM編碼器之后每個樣本的精度為8位,輸出的數(shù)據(jù)率為64 kb/s。這個數(shù)據(jù)就是CCITT推薦的G.711標準。自適應差值脈沖編碼調(diào)制原理(自適應差值脈沖編碼調(diào)制原理(ADPCM)v差值脈沖編碼(差值脈沖編碼(DPCM)v1.編碼思想編碼思想提高通信
12、質(zhì)量提高通信質(zhì)量必須必須減小量化誤差減小量化誤差減小量化級減小量化級當抽樣值范圍確定時當抽樣值范圍確定時增加編碼增加編碼位數(shù)位數(shù)Nv增加編碼位數(shù)可獲得大的信噪比增加編碼位數(shù)可獲得大的信噪比在編碼位數(shù)固定時,減小抽樣值的變化在編碼位數(shù)固定時,減小抽樣值的變化范圍,也同樣可以提高信噪比范圍,也同樣可以提高信噪比即:若縮小抽樣值(被編碼信號)的即:若縮小抽樣值(被編碼信號)的變化范圍,就可以在保證信噪比不變變化范圍,就可以在保證信噪比不變的情況下,減小編碼的位數(shù)。這就是的情況下,減小編碼的位數(shù)。這就是差值編碼的中心思想差值編碼的中心思想增量調(diào)制(M)增量調(diào)制 (delta modulation,DM
13、) 是一種預測編碼技術,是對實際的采樣信號與預測的采樣信號之差的極性進行編碼,將極性變成“0”和“1”這兩種可能的取值之一。如果實際的采樣信號與預測的采樣信號之差的極性為“正”,則用“1”表示;相反則用“0”表示。DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。 二、差值編碼模型圖二、差值編碼模型圖在原來的抽樣值中減去某一個值,然后在原來的抽樣值中減去某一個值,然后對兩者之差進行編碼。在接收端將解碼對兩者之差進行編碼。在接收端將解碼值再加上發(fā)送端所減去的值便可恢復出值再加上發(fā)送端所減去的值便可恢復出原始值。原始值。 x(n) + d(n) c(n) d(n) x(n) - x(n) x(n) 差值編碼模型差值
14、編碼模型譯碼譯碼+編碼編碼+圖中:圖中:x(n)是原始樣值(是原始樣值(n時刻的抽樣值)時刻的抽樣值)x(n)為減去量為減去量d(n)=x(n)-x(n) 為差值為差值可以看出:可以看出:(1)、)、d(n)越小,在相同的編碼位數(shù)時越小,在相同的編碼位數(shù)時信噪比越大信噪比越大(2)、收發(fā)端必須有相同的減去量)、收發(fā)端必須有相同的減去量x(n)根據(jù)前些時刻的樣值來預測現(xiàn)時刻的樣根據(jù)前些時刻的樣值來預測現(xiàn)時刻的樣值,只要傳遞預測值和實際值之差,而值,只要傳遞預測值和實際值之差,而不需要每個樣值的編碼都傳。這種方法不需要每個樣值的編碼都傳。這種方法就稱為就稱為DPCM編碼。編碼。v三、三、DPCM系
15、統(tǒng)系統(tǒng)1、DPCM系統(tǒng)的概念:系統(tǒng)的概念:v舉例來說舉例來說,設以設以1/Ts1/Ts的速率對信號的速率對信號S S(t t)抽)抽樣樣,在在 時刻前可得到時刻前可得到 , 等一組樣值等一組樣值.以前面以前面N N個個樣值作為基礎對樣值作為基礎對 的預測值是的預測值是snTt =sSTnTSsSTnTS2sSNTnTSSnTSSSNiiSiTnTSWnTS=1不同時刻樣值的加權系數(shù)不同時刻樣值的加權系數(shù):根據(jù)相關性情況,可設根據(jù)相關性情況,可設 為常量或變量為常量或變量iWiW2、實現(xiàn)預測的橫向濾波器(、實現(xiàn)預測的橫向濾波器(N階預測器)階預測器)在每個抽樣時刻到來時,濾波器輸出將在每個抽樣時
16、刻到來時,濾波器輸出將會給出下一個樣值的預測值。會給出下一個樣值的預測值。SnTS一般來說,在抽樣時刻一般來說,在抽樣時刻 t=nTs 時所得的預測時所得的預測值值 與真正的樣值與真正的樣值 并不相同。并不相同。SnTSSSNiiSiTnTSWnTS=1N階預測器輸出:階預測器輸出:差值脈沖編碼就是對真正的樣值差值脈沖編碼就是對真正的樣值 與過與過去的樣值為基礎得到的估值去的樣值為基礎得到的估值 之之間的差值進行量化和編碼。間的差值進行量化和編碼。SnTSSnTS3、DPCM系統(tǒng)模型框圖系統(tǒng)模型框圖量化器量化器預測器預測器預測器預測器下張圖中:圖中:x(n)為抽樣信號的實際值為抽樣信號的實際值
17、vd(n)=x(n)-x(n)圖x(n)=x(n)+d(n)該系統(tǒng)的量化誤差可以表示為:該系統(tǒng)的量化誤差可以表示為:e(n)=x(n)-x(n) =d(n)+x(n)-x(n)+d(n) =d(n)-d(n)v上式表明:系統(tǒng)的傳輸誤差上式表明:系統(tǒng)的傳輸誤差就是差值()的量化誤差就是差值()的量化誤差4、DPCM系統(tǒng)的抗噪聲性能分析系統(tǒng)的抗噪聲性能分析系統(tǒng)信噪比定義為:系統(tǒng)信噪比定義為:v)()(22neEnxE=)()()()(2222neEndEndEnxE=qPSNRG 預測器增益預測器增益量化器的量化量化器的量化信噪比信噪比GP1預測器有預測器有增益增益加預測器后加預測器后反而不利反而
18、不利2x2d2eGP : DPCM系統(tǒng)相對于系統(tǒng)相對于PCM系統(tǒng)而言的系統(tǒng)而言的信噪比增益。信噪比增益。量化器產(chǎn)生的信噪比量化器產(chǎn)生的信噪比qSNR即非預測的即非預測的PCM系統(tǒng)的量化信噪比系統(tǒng)的量化信噪比提高系統(tǒng)信噪比采取的措施提高系統(tǒng)信噪比采取的措施)()()()(2222neEndEndEnxEv)(2ndE)(2neE減小減小 x(n)精確精確)(2ndEd(n)d(n)=x(n)-x(n)最佳預測最佳預測)(2neE量化誤差量化誤差最佳量化最佳量化小結(jié)小結(jié)v一一.壓縮編碼的原因壓縮編碼的原因v二二.什么是語音壓縮編碼什么是語音壓縮編碼v三三.語音編碼分類語音編碼分類vADPCM系統(tǒng)系
19、統(tǒng)vDPCMv一一.差值編碼思想差值編碼思想v二二.差值編碼系統(tǒng)模型圖差值編碼系統(tǒng)模型圖v三三.DPCM系統(tǒng)系統(tǒng)v1.概念概念2.預測器模型圖預測器模型圖3.DPCM系統(tǒng)模型系統(tǒng)模型4.DPCM系統(tǒng)的抗噪聲性能分析系統(tǒng)的抗噪聲性能分析自適應差值脈沖編碼調(diào)制(自適應差值脈沖編碼調(diào)制(ADPCM)1、實質(zhì):、實質(zhì):DPCM+自適應量化和自適應預測自適應量化和自適應預測固定預測固定預測 固定量化固定量化2、定義、定義能夠?qū)崿F(xiàn)自適應預測功能,或者能夠?qū)崿F(xiàn)自適應預測功能,或者自適應量化功能或者同時實現(xiàn)兩自適應量化功能或者同時實現(xiàn)兩種自適應功能的種自適應功能的DPCM系統(tǒng)稱為系統(tǒng)稱為ADPCM系統(tǒng)。系統(tǒng)。
20、3.設計的目的設計的目的vADPCM充分利用了語音波形的統(tǒng)計特充分利用了語音波形的統(tǒng)計特征和人耳聽覺特性征和人耳聽覺特性,其設計思路主要瞄準其設計思路主要瞄準了兩個目標了兩個目標:a: 盡可能去掉語音信號中的冗余信號盡可能去掉語音信號中的冗余信號b:以有效的方式將可用比特分配給語音信以有效的方式將可用比特分配給語音信號號對消除冗余后的信號對消除冗余后的信號,從自適應角度從自適應角度進行最佳編碼進行最佳編碼1.1預測的自適應預測的自適應(1).極點預測器極點預測器1.預測器的結(jié)構(gòu)預測器的結(jié)構(gòu)(用重建信號用重建信號x(n)進行的預測)進行的預測)+量化器量化器預測器預測器+X(n)X(n)d(n)
21、d(n)編碼編碼X(n)P(Z)X(n)a:極點預測器的方框圖極點預測器的方框圖b:預測器傳遞函數(shù)預測器傳遞函數(shù)P(z) )()()(ZXZXZP=N階預測器公式:階預測器公式:X(n)=)(1jnxaNjj=進行進行Z變換后得:變換后得:jNjjzzxazx=)()(1則預測器的傳遞函數(shù)為:則預測器的傳遞函數(shù)為:)()()(ZXZXZP=jNjjza=1為預測系數(shù)為預測系數(shù)jac:重建濾波器重建濾波器+預測器預測器x(n)x(n)X(n)d(n)H(Z)重建濾波器重建濾波器=)1 ( 2 12Px2d2x=E x(n)+Ex(n-1)-2Ex(n)x(n-1)22=2E x(n)-2Ex(n
22、)x(n-1)2分析:分析:)()(22ndEnxEPG=)1 ( 211p()一階()一階最佳最佳線性預測線性預測求最佳預測系數(shù)求最佳預測系數(shù)h1N=1時;時;X(n)=h1x(n-1)則差值信號為:則差值信號為:d(n)=x(n)-h1x(n-1)+Ed (n)=2d2=Ex(n)- h1x(n-1) 2=E x(n)+h1Ex(n-1)-2h1Ex(n)x(n-1)22=2x2d21xh2-2112xPh=)21 (1112Phhx2求使求使最小的最小的h1的值的值2012=hdmin2)(d221)1 (xp=令令得最佳預測系數(shù)得最佳預測系數(shù)h1opt=p1當當N=1時的最大預測增益為
23、:時的最大預測增益為:)1 (121maxpGp=b.二階線性預測(二階線性預測(N=2)d(n)=x(n)-h1x(n-1)-h2x(n-2)2d=Ed (n)2=Ex(n)- h1x(n-1)-h2(n-2) 2令令012=hd022=hd得最佳得最佳h1,h2212111)1 (ppphopt=2121221 ppphopt=2212222121min21)(1 )(xdpppp=大于或者大于或者等于零等于零故二階預測器總是優(yōu)于一階預測器故二階預測器總是優(yōu)于一階預測器C:N階最佳線性預測階最佳線性預測2d求偏微分,并令為零求偏微分,并令為零NiadEi,.2,102=)()(21jksa
24、ksENii=Ed (k)2所以得到一組線性方程所以得到一組線性方程12(1)(0 )(1).(1)(2 )(1)(0 ).(2 ).(1)(2 ) .(0 )()o p to p tN o p tRaRRRNRaRRRNRNRNRaRN=1optssssRr =12(1)(0)(1).(1)(2)(1)(0).(2).,.(1) (2) .(0)()optoptssssoptaRRRR NaRRRR NrRaR NR NRR N= = 其中.Nopta差值信號在差值信號在最小最小 )()()(21min2=NiioptikSakSEkdE最佳預測增益最佳預測增益=NiioptPoptkSEi
25、RakdEkSEG1222)()(11)()(2.自適應預測自適應預測l1)前向自適應預測算法前向自適應預測算法根據(jù)短時間的相關特性根據(jù)短時間的相關特性R(i),求短時的最佳預求短時的最佳預測系數(shù)測系數(shù)特點特點:運算量大,延遲時間大,不能用于高運算量大,延遲時間大,不能用于高速系統(tǒng)。速系統(tǒng)。采用不斷修正預測系數(shù)采用不斷修正預測系數(shù)hi(n)的方法來減小瞬時平方的方法來減小瞬時平方差差Ed(n),使使hi(n)逐步的接近逐步的接近hiopt(n).2)后向序貫自適應預測算法)后向序貫自適應預測算法2)()()()(1inxnhnxndNii=)()()()() 1(inxndnnhnhiii=梯度系數(shù),它決定了預測系數(shù)自適應速率梯度系數(shù),它決定了預測系數(shù)自適應速率)(sgn)(sgn)()() 1(inxndnnhnhiiii=)(sgn)(sgn)()() 1(indndnnhnhiiii=極點預測器極點預測器零點預測器零點預測器衰減因子衰減因子(抗誤碼因子抗誤碼因子)1.2量化的自適應量化的自適應1、最佳量化、最佳量化分層電平為相鄰量化電平的中點分層電平為相鄰量化電平的中點量化電平是該量化間隔內(nèi)經(jīng)常出現(xiàn)的瞬量化電平是該量化間隔內(nèi)經(jīng)常出現(xiàn)的瞬時電平值時電平值固定量化器固定量化器+可可變增益放大器變增益放大器2、自適應
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 六一游戲集市活動方案
- 六一酒館活動策劃方案
- 六一預售活動方案
- 六味齋營銷活動策劃方案
- 六年級漢語拼音活動方案
- 業(yè)務助理考試試題及答案
- 安全生產(chǎn)電工試題及答案
- 藥師考試試題及答案解析
- 安全設施管理試題及答案
- 安全評價知識試題及答案
- 《現(xiàn)場改善案例集》課件
- 醫(yī)院結(jié)核感染培訓
- 2025年廣東省廣州市花都區(qū)交通局建管中心招聘14人歷年高頻重點提升(共500題)附帶答案詳解
- 臨床心內(nèi)科主任競聘稿
- 電動工器具安全使用培訓
- 垃圾焚燒爐安裝及方案
- 防水工程專項施工方案
- 幼兒教師講故事技巧培訓
- 日本建設項目可視化、安全文明、工藝管理總結(jié)
- 【MOOC】思想道德與法治-南開大學 中國大學慕課MOOC答案
- 網(wǎng)絡管理與維護綜合實訓課程
評論
0/150
提交評論