




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
高級(jí)音響師實(shí)用教程上部1-5章目錄\h第1章數(shù)字聲頻技術(shù)基礎(chǔ)\h1.1A/D轉(zhuǎn)換\h1.1.1采樣\h1.1.2濾波和混疊\h1.1.3量化\h1.1.4采樣分辨率的可聞效果\h1.1.5高頻顫動(dòng)的使用\h1.1.6高頻顫動(dòng)的種類\h1.1.7A/D轉(zhuǎn)換中的過(guò)采樣\h1.1.8A/D轉(zhuǎn)換中的噪聲整形\h1.2D/A轉(zhuǎn)換\h1.2.1基本的D/A轉(zhuǎn)換\h1.2.2D/A轉(zhuǎn)換中的過(guò)采樣\h1.3音質(zhì)與采樣頻率和分辨率之間的關(guān)系\h1.3.1心理聲學(xué)限制\h1.3.2采樣頻率\h1.3.3量化分辨率\h1.4數(shù)字化處理的相關(guān)問(wèn)題\h1.4.1時(shí)基抖動(dòng)及對(duì)轉(zhuǎn)換器的影響\h1.4.2改變聲頻信號(hào)的分辨率(再量化)\h1.4.3動(dòng)態(tài)范圍擴(kuò)展\h1.4.4誤碼校正\h1.5數(shù)字聲頻信號(hào)處理\h1.5.1電平控制\h1.5.2交叉漸變\h1.5.3調(diào)音\h1.5.4數(shù)字濾波器和均衡\h1.5.5數(shù)字混響和其他效果\h1.5.6動(dòng)態(tài)處理\h1.5.7采樣頻率轉(zhuǎn)換\h第2章數(shù)字聲頻記錄技術(shù)\h2.1數(shù)字錄音帶(DAT)\h2.1.1DAT盒式磁帶的構(gòu)造\h2.1.2DAT模式的分類與特點(diǎn)\h2.1.3DAT硬件設(shè)計(jì)的基本方案\h2.1.4磁道上的記錄格式\h2.1.5DAT的方位記錄與自動(dòng)磁道跟蹤\h2.1.68-10調(diào)制碼記錄方式\h2.1.7DAT的糾錯(cuò)編碼\h2.1.8DAT的時(shí)間碼\h2.2DVD\h2.2.1概述\h2.2.2DVD-Video\h2.2.3DVD-Audio\h2.3MP3\h2.3.1MP3播放機(jī)的特點(diǎn)與主要性能\h2.3.2MP3播放機(jī)的工作原理\h2.3.3MP3播放機(jī)的使用\h第3章數(shù)字調(diào)音臺(tái)\h3.1數(shù)字調(diào)音臺(tái)的特點(diǎn)\h3.2VENUE數(shù)字調(diào)音臺(tái)的特點(diǎn)\h3.3調(diào)音臺(tái)的使用\h3.3.1調(diào)音臺(tái)背面板\h3.3.2調(diào)音臺(tái)前面板\h3.3.3操作控制屏幕與軟件\h3.4調(diào)音操作步驟\h第4章MIDI(樂(lè)器數(shù)字接口)\h4.1MIDI的硬件\h4.2MIDI信息的組成\h4.2.1通道信息\h4.2.2系統(tǒng)信息\h4.3MIDI制作系統(tǒng)中的設(shè)備\h4.3.1概述\h4.3.2MIDI鍵盤合成器\h4.3.3音源\h4.3.4鼓機(jī)\h4.3.5MIDI音序器\h4.3.6MIDI效果器\h4.4MIDI設(shè)備在錄音中的應(yīng)用\h4.5電腦音樂(lè)制作系統(tǒng)\h4.5.1電腦音樂(lè)制作系統(tǒng)的組成\h4.5.2電腦音樂(lè)制作系統(tǒng)在音樂(lè)節(jié)目制作中的應(yīng)用\h第5章數(shù)字聲頻工作站\h5.1數(shù)字聲頻工作站的構(gòu)成\h5.1.1專門的系統(tǒng)\h5.1.2以桌面計(jì)算機(jī)為基礎(chǔ)的系統(tǒng)\h5.2數(shù)字聲頻工作站的聲頻處理\h5.2.1大容量存儲(chǔ)媒體聲音的記錄原理\h5.2.2多聲道記錄和重放\h5.2.3聲頻編輯\h5.2.4時(shí)基和同步\h5.2.5變速操作\h5.2.6工作站中的DSP\h5.3文件格式及數(shù)據(jù)交換\h5.3.1聲頻文件格式\h5.3.2開放媒體構(gòu)架交換(OMFI)\h5.3.3CD預(yù)母版格式\h5.3.4數(shù)字聲頻接口\h5.3.5數(shù)字信號(hào)同步\h5.3.6網(wǎng)絡(luò)\h5.4數(shù)字聲頻工作站中的視頻技術(shù)\h5.4.1數(shù)字視頻基礎(chǔ)\h5.4.2視頻數(shù)據(jù)壓縮\h5.4.3MPEG和JPEG\h5.4.4桌面視頻系統(tǒng)\h5.4.5用于聲頻工作站的數(shù)字視頻選件\h5.4.6SMPTE/EBU時(shí)碼\h5.4.7丟幀時(shí)碼格式\h5.4.8時(shí)碼的處理第1章數(shù)字聲頻技術(shù)基礎(chǔ)本章將簡(jiǎn)要介紹有關(guān)數(shù)字聲頻技術(shù)的基礎(chǔ)知識(shí),主要闡述那些在數(shù)字聲頻中影響聲音質(zhì)量的有關(guān)問(wèn)題,并對(duì)聲頻數(shù)字信號(hào)處理(DSP)作一個(gè)簡(jiǎn)要的介紹。數(shù)字聲頻系統(tǒng)的基本結(jié)構(gòu)如圖1-1所示。模擬聲頻信號(hào)在A/D轉(zhuǎn)換中被轉(zhuǎn)換成二進(jìn)制值。這些二進(jìn)制值經(jīng)各種方式的DSP后,被編碼并且存儲(chǔ)起來(lái),或者被傳送出去。存儲(chǔ)或者傳送的信號(hào)仍可進(jìn)行進(jìn)一步的處理,然后轉(zhuǎn)換回模擬域。圖1-1數(shù)字聲頻系統(tǒng)基本結(jié)構(gòu)框圖1.1A/D轉(zhuǎn)換A/D轉(zhuǎn)換是決定數(shù)字聲頻信號(hào)最終質(zhì)量?jī)?yōu)劣的最重要的一環(huán)。事實(shí)上,一個(gè)聲頻信號(hào)在進(jìn)行了轉(zhuǎn)換處理之后,其聲音質(zhì)量只有變壞的可能,而絕無(wú)轉(zhuǎn)好的希望。許多聲頻處理純粹是在數(shù)字域中進(jìn)行的,在這種情況下,A/D轉(zhuǎn)換并非關(guān)鍵所在,但是大多數(shù)的操作仍然不時(shí)地需要從模擬域上獲得聲音素材。工作站的價(jià)格各不相同,因此這些數(shù)字聲頻工作站及其周邊轉(zhuǎn)換器的質(zhì)量也有優(yōu)劣之分。許多分立的專業(yè)轉(zhuǎn)換器的價(jià)格都相當(dāng)于一個(gè)臺(tái)式計(jì)算機(jī)的全部數(shù)字聲頻硬件和軟件的價(jià)格。如今,在許多多媒體臺(tái)式計(jì)算機(jī)中都能見到16bit的轉(zhuǎn)換器,然而與最有效的那些設(shè)備相比,這些設(shè)備的表現(xiàn)很不理想。正如在下面所要看到的,采樣率以及每個(gè)采樣的比特?cái)?shù)是決定一個(gè)數(shù)字聲頻信號(hào)質(zhì)量?jī)?yōu)劣的主要因素,而轉(zhuǎn)換器的質(zhì)量卻表明在這些限制之下,是否能更接近極限。除此之外,必須承認(rèn)的一點(diǎn)是:對(duì)于很多人來(lái)說(shuō),一個(gè)16bit的轉(zhuǎn)換器聽起來(lái)與別的并沒(méi)有什么不同,很多時(shí)候價(jià)格與質(zhì)量并不是成正比的。1.1.1采樣模擬的聲頻信號(hào)是在時(shí)間上連續(xù)的電信號(hào),而A/D轉(zhuǎn)換器的任務(wù)正是將這一信號(hào)轉(zhuǎn)換為在時(shí)間上離散的二進(jìn)制數(shù)序列。在轉(zhuǎn)換器中,采樣過(guò)程包括對(duì)聲頻波形的振幅在規(guī)定的間隔上及時(shí)進(jìn)行測(cè)量或采樣,如圖1-2所示。顯然,采樣脈沖準(zhǔn)確地表示出了信號(hào)在每一時(shí)刻的瞬間振幅。采樣可被看作是當(dāng)快速連續(xù)播放時(shí)組成連續(xù)動(dòng)感電影的一個(gè)個(gè)靜止幀。圖1-2任意聲頻信號(hào)以規(guī)律的時(shí)間間隔被采樣基于詳細(xì)地表征一個(gè)信號(hào)的需要,有必要在每秒鐘獲取大量的采樣值,同時(shí)香農(nóng)采樣定理指出:如果一個(gè)信號(hào)的必要信息能被恢復(fù),那么在每一個(gè)聲頻周期必須至少得有兩個(gè)采樣。從圖1-3中可以看到,如果在聲頻信號(hào)的每一個(gè)周期只獲得很少的采樣,那么采樣所描繪的可能會(huì)迥異于其采樣的原始波形,這也是有助于理解混疊這一現(xiàn)象的一種方法。通過(guò)D/A轉(zhuǎn)換來(lái)恢復(fù)出被采樣的信號(hào)時(shí),混疊會(huì)產(chǎn)生原始信號(hào)不需要的成分。圖1-3每一聲頻周期必須至少得到兩個(gè)采樣將采樣過(guò)程形象化的另一個(gè)方法是把它放在調(diào)制的情況下加以考慮,就像在圖1-4中表示的那樣。連續(xù)的聲頻波形被用來(lái)調(diào)制一個(gè)規(guī)則的脈沖序列,這些脈沖的頻率就是采樣頻率。在調(diào)制之前,所有這些脈沖都有同樣的振幅(高度),但是在調(diào)制之后,脈沖的振幅將根據(jù)聲頻信號(hào)在該點(diǎn)的瞬時(shí)振幅被加以修正。這一過(guò)程稱之為脈沖振幅調(diào)制(PAM),調(diào)制信號(hào)的頻譜如圖1-5所示??梢钥匆?,除了“基帶”聲頻信號(hào)(采樣前的原始頻譜)之外,現(xiàn)在又出現(xiàn)了許多額外的頻譜,并以采樣頻率的倍頻頻率為中心,呈對(duì)稱分布。作為振幅調(diào)制的一個(gè)結(jié)果,采樣頻率及其倍頻的每一邊都產(chǎn)生了邊帶,它將采樣頻率及其倍頻上下延伸基帶寬度。換言之,這樣的邊帶是聲頻頻帶的對(duì)稱鏡像。圖1-4放在脈沖振幅調(diào)制下的采樣圖1-5調(diào)制信號(hào)的頻譜1.1.2濾波和混疊從圖1-6中可以容易地看出,為什么采樣頻率必須至少兩倍于信號(hào)基帶所含的最高頻率。這是因?yàn)椋撼^(guò)奈奎斯特(Nyquist)采樣頻率的一個(gè)擴(kuò)展的基帶導(dǎo)致了第一個(gè)重復(fù)頻譜的較低的邊帶重疊在基帶的較后部分。這里舉出兩個(gè)例子來(lái)進(jìn)一步說(shuō)明:在第一個(gè)例子中,一個(gè)基帶聲音有足夠低的頻率,其采樣了的邊帶頻率處在聲頻范圍之上;而在第二個(gè)例子中,一個(gè)較高的頻率產(chǎn)生了較低的采樣邊帶,正好落在基帶之內(nèi),形成對(duì)原始聲音的一個(gè)混疊。圖1-6在頻域內(nèi)觀察的混疊在大家所熟悉的電影“輪幅”效應(yīng)中,就能夠看到混疊這種現(xiàn)象,因?yàn)椴粩嘧儞Q的畫面也是信號(hào)采樣的一個(gè)例子。在影片中,靜止畫面(影像樣本)在正常情況下是以24幀每秒的速度獲取的。如果拍攝一個(gè)有著參考標(biāo)志的旋轉(zhuǎn)的車輪,當(dāng)靜止畫面的播放速度比旋轉(zhuǎn)的速度快得多的話,將會(huì)感到車輪向前轉(zhuǎn)動(dòng),但是隨著旋轉(zhuǎn)速度的增加,車輪將表現(xiàn)出減速、停止、開始向后運(yùn)動(dòng)的效果。當(dāng)車輪旋轉(zhuǎn)的速度變得更快時(shí),實(shí)際效果所表現(xiàn)出的向后運(yùn)動(dòng)速度也將變快,這個(gè)向后的動(dòng)作就是由于以一個(gè)很低的速度進(jìn)行采樣所產(chǎn)生的混疊。顯然,車輪其實(shí)并沒(méi)有向后,但其視覺效果卻是如此。在數(shù)字錄音中,如果允許一個(gè)聲頻信號(hào)產(chǎn)生混疊,重放時(shí)也將會(huì)聽到如同向后旋轉(zhuǎn)車輪般的聽覺效果——也就是說(shuō),在第一邊頻沒(méi)有可聞?lì)l譜中的聲音成分,隨著信號(hào)原始頻率的增加,其頻率下降。所以,在基本的轉(zhuǎn)換器中,必須在采樣之前就對(duì)基帶聲頻信號(hào)進(jìn)行濾波,如圖1-7中所示,從而除去一些超過(guò)1/2采樣頻率(即奈奎斯特頻率)的部分。圖1-7在轉(zhuǎn)換前使用模擬的抗混疊濾波器濾去輸入信號(hào)中超過(guò)奈奎斯特采樣頻率的成分在實(shí)際系統(tǒng)中,因?yàn)椴豢赡苡欣硐牖臑V波器,采樣頻率要稍微高于兩倍的記錄頻帶上限,允許通帶與阻帶的過(guò)渡特性不是非常陡峭。在D/A和A/D轉(zhuǎn)換器中采用的濾波器對(duì)聲音音色有明顯的影響,因?yàn)樗鼈儧Q定了在聲頻頻帶內(nèi)頻率響應(yīng)的線性,在高頻處傾斜衰減,以及系統(tǒng)具有線性相位響應(yīng)。在一個(gè)非過(guò)采樣轉(zhuǎn)換器中,濾波器必須濾掉所有高于1/2采樣頻率的信號(hào),至少也要衰減80dB。陡峭的濾波器很可能在高頻處有不確定的相位響應(yīng),同時(shí)由于濾波器的高Q值可能表現(xiàn)出“鈴響”,因此陡峭濾波器也有缺點(diǎn),其制作也非常復(fù)雜。盡管濾波器的影響在許多方面是不可避免的,但制作者已經(jīng)在抗混疊和平滑濾波器研究設(shè)計(jì)方面取得了長(zhǎng)足的進(jìn)展,許多目前采用的性能較差的濾波器,其性能已有所改進(jìn),一個(gè)積極的效果即反映在音質(zhì)的改善上。過(guò)采樣處理有助于減少模擬濾波產(chǎn)生的問(wèn)題,因?yàn)樗鼘⒒鶐У牡谝粋€(gè)重復(fù)邊帶移至更高的頻率上,這樣便允許使用較緩衰減斜率的濾波器。1.1.3量化采樣之后,調(diào)制的脈沖序列被量化。在量化一個(gè)采樣信號(hào)時(shí),采樣的振幅被轉(zhuǎn)換成一些階梯狀變化的值,如圖1-8所示。量化器決定量化間距的固定數(shù)據(jù)(Q值的大?。?,每一個(gè)采樣都位于其中,然后分配給它一個(gè)值來(lái)表示這個(gè)值的中心點(diǎn)。這樣做的目的在于在脈沖編碼調(diào)制中,每一個(gè)采樣振幅都能由一個(gè)唯一的二進(jìn)制數(shù)來(lái)表示。在線性量化中,每一個(gè)量化階梯等同于信號(hào)電平的增量,在二進(jìn)制系統(tǒng)中,量化階梯數(shù)等于2n。這里n是指的二進(jìn)制中的比特?cái)?shù),它用來(lái)表征每一個(gè)采樣。因此,一個(gè)4bit轉(zhuǎn)換器僅僅提供了24(16)個(gè)量化步階,而一個(gè)16bit的量化器則可提供多達(dá)216(65536)個(gè)量化步階。圖1-8量化時(shí)采樣的振幅被轉(zhuǎn)換成一些階梯狀變化值能夠隨時(shí)有效表示信號(hào)振幅的離散步階的數(shù)目是有限的,所以在量化過(guò)程中會(huì)有誤差產(chǎn)生。誤差的最大值將為正負(fù)半個(gè)步階的幅度,并且假如所表示的模擬電平保持不變的話,那么每個(gè)采樣大量的比特?cái)?shù)也將產(chǎn)生一個(gè)較小的誤差。圖1-9所示的是在不同的分辨率下,數(shù)字聲頻信號(hào)所處的二進(jìn)制數(shù)范圍,通常使用2的補(bǔ)碼形式表示。由圖1-9可以看到,一個(gè)16bit信號(hào)最大的確定采樣值是7FFF,同時(shí)最大的負(fù)值為8000。在其通過(guò)0V點(diǎn)時(shí),采樣值從全零(0000)變化至全1(FFFF),最大數(shù)字信號(hào)電平通常稱為0dBFS(FS意為滿刻度)。超過(guò)這個(gè)電平的信號(hào)被削波,導(dǎo)致了嚴(yán)重的失真,如圖1-10所示。圖1-9不同的分辨率下數(shù)字聲頻信號(hào)所處的二進(jìn)制范圍圖1-10數(shù)字系統(tǒng)中超過(guò)峰值點(diǎn)電平的信號(hào)被削波情況1.1.4采樣分辨率的可聞效果量化誤差可以認(rèn)為是一個(gè)不想要的信號(hào)疊加在了想要的信號(hào)之上,如圖1-11所示。根據(jù)它們的特性,不想要的信號(hào)可劃分為失真或噪聲,相關(guān)的聲頻信號(hào)的性質(zhì)和電平很大程度上又決定了信號(hào)量化誤差的性質(zhì)。下面的幾個(gè)例子通過(guò)圖示的方法對(duì)16bit采樣分辨率時(shí)數(shù)字域的清晰度進(jìn)行了說(shuō)明。圖1-11量化誤差被加在原始采樣值上首先讓我們考慮一個(gè)電平很低的正弦波信號(hào),它被采樣隨后又被量化,其電平僅僅夠讓它在峰值的時(shí)候,使得量化器的最低有效比特開啟或關(guān)閉,如圖1-12(a)所示。這樣一個(gè)信號(hào)會(huì)產(chǎn)生一個(gè)周期性的、與信號(hào)緊密相關(guān)的量化誤差,導(dǎo)致了諧波失真。圖1-12(b)所示為該信號(hào)的頻譜分析,它清楚地表明在原來(lái)的基礎(chǔ)之上所產(chǎn)生失真的成分(偶次諧波占主要地位)。一旦信號(hào)降至開啟LSB(最低有效位)的電平之下,也許就沒(méi)有調(diào)制了。因此,將一個(gè)信號(hào)衰減至無(wú)聲,反映在聽覺上的效果就是一個(gè)逐漸增加的失真信號(hào)突然消失。如正弦波信號(hào)電平較高則會(huì)越過(guò)更多的量化間隔,并產(chǎn)生更多的非零采樣值。隨著信號(hào)電平的增加,量化誤差最大值仍然是±0.5Q,但占整個(gè)信號(hào)電平的比例逐漸減小,同時(shí)誤差也逐漸與信號(hào)失去相關(guān)性。圖1-12電平很低的正弦信號(hào)被采樣隨后又被量化情況現(xiàn)在考慮一個(gè)有合理高電平的音樂(lè)信號(hào),它的振幅以及頻譜特征變化很大,因此其量化誤差有著隨機(jī)的特性。換句話說(shuō),這更像噪聲,而非失真,因此經(jīng)常用量化噪聲來(lái)描述由量化誤差所造成的聽覺上的效果。分析量化誤差的功率時(shí),假定它有類似于噪聲的特性,表明它有的均方根振幅,這里Q是用一個(gè)量化間隔來(lái)表示電壓增量。所以一個(gè)理想的n比特量化信號(hào)的信噪比(S/N)可以被表示為:6.02n+1.76dB這意味著理想的S/N大約稍稍超過(guò)6dB/bit。所以可以估算出一個(gè)16bit的轉(zhuǎn)換器的S/N大約是98dB,而一個(gè)8bit轉(zhuǎn)換器大約為50dB。這里所假設(shè)的是一個(gè)非顫動(dòng)的轉(zhuǎn)換器。如果一個(gè)轉(zhuǎn)換器是非顫動(dòng)的,那么當(dāng)有信號(hào)時(shí),將只有量化噪聲存在,但是當(dāng)信號(hào)不存在的時(shí)候則沒(méi)有靜態(tài)本底噪聲。1.1.5高頻顫動(dòng)的使用在A/D轉(zhuǎn)換以及在進(jìn)行不同的采樣分辨率間的轉(zhuǎn)換時(shí)使用高頻顫動(dòng)的做法,現(xiàn)在已經(jīng)被普遍接受。它具有對(duì)普通的轉(zhuǎn)換器實(shí)施線性化的作用(換言之,它可有效地將每一個(gè)量化間隔均勻化),同時(shí)它可將量化失真轉(zhuǎn)化為一種隨時(shí)都有的類似隨機(jī)噪聲的信號(hào)(即白噪聲)。這種方法之所以很受歡迎有幾種原因。首先,白噪聲在低電平的情況下不像失真那樣讓人感覺討厭;其次,它允許信號(hào)平緩地衰減至無(wú)聲,而不像前面提到的那樣突然消失;再者,即使在信號(hào)的電平降至系統(tǒng)的本底噪聲之下的時(shí)候,通常也可將信號(hào)重新恢復(fù)。在信號(hào)電平下降時(shí),沒(méi)有加入高頻顫動(dòng)的聲頻信號(hào)聽起來(lái)有“顆粒感”,同時(shí)覺得失真了。當(dāng)高頻顫動(dòng)打開時(shí),細(xì)微的“咝咝”聲將消失,使得系統(tǒng)聽起來(lái)更加安靜,但通常卻認(rèn)為少量的連續(xù)的“咝咝”聲與低電平失真相比,前者更加可取。對(duì)轉(zhuǎn)換器的高頻顫動(dòng)處理就是將一個(gè)很低電平的信號(hào)加入到聲頻信號(hào)上,其振幅取決于顫動(dòng)所使用的類型。高頻顫動(dòng)信號(hào)通常是噪聲,但也可能是一半采樣頻率的一個(gè)波形,或者是兩者的結(jié)合。一個(gè)在A/D轉(zhuǎn)換過(guò)程中沒(méi)有被正確加入顫動(dòng)的信號(hào),不可能在以后通過(guò)高頻顫動(dòng)達(dá)到同樣的效果,因?yàn)樾盘?hào)已經(jīng)產(chǎn)生了不可挽回的失真。高頻顫動(dòng)是怎樣完成除去量化失真這一任務(wù)呢?前面已經(jīng)說(shuō)明,失真是信號(hào)與量化誤差之間存在相關(guān)性所造成的,從而導(dǎo)致了誤差的周期性,并產(chǎn)生了主觀上嘈雜不安的聽感。如圖1-13所示,將一個(gè)隨機(jī)的噪聲信號(hào)加在聲頻信號(hào)之上使量化誤差隨機(jī)化,并使其聽起來(lái)有點(diǎn)類似噪聲的效果,若一個(gè)噪聲的振幅與LSB的值相當(dāng)(換句話講,為一個(gè)量化階梯),那么一個(gè)準(zhǔn)確位于一個(gè)量化間距和下一個(gè)之間的關(guān)鍵點(diǎn)位置的信號(hào)會(huì)被量化到上面或下面去,這要取決于加在其上的高頻顫動(dòng)噪聲的瞬時(shí)電平。一段時(shí)間之后,這一隨機(jī)的效果將被平均化,產(chǎn)生一個(gè)類似于噪聲的量化誤差,并且系統(tǒng)有一個(gè)固定的本底噪聲。圖1-13量化誤差隨機(jī)化及類似噪聲效果圖1-13(a)與圖1-12所表示的是同樣的一個(gè)低電平正弦波,但它加入了高頻顫動(dòng)噪聲。被量化的信號(hào)保持著1kHz正弦波的振動(dòng)方式,但是現(xiàn)在它更頻繁地被調(diào)制,并且其中加入了隨機(jī)的成分。這一信號(hào)的頻譜如圖1-14(b)所示,它表明伴隨著單一正弦波成分的還有一個(gè)平穩(wěn)的本底噪聲。圖1-14(c)和(d)表明加入了高頻顫動(dòng)的正弦波的波形和頻譜,這個(gè)正弦波的電平在未加高頻顫動(dòng)處理的16bit系統(tǒng)中是無(wú)法表示的。但是如果仔細(xì)研究的話會(huì)發(fā)現(xiàn),原始1kHz周期性變化成分仍然可以在其調(diào)制型中看見。LSB調(diào)制占空比(時(shí)間開和關(guān)之間的比率)隨著原始信號(hào)的振幅而變化。當(dāng)它通過(guò)一個(gè)D/A轉(zhuǎn)換器和重建濾波器后,其結(jié)果為一個(gè)純粹的正弦波信號(hào)加上噪聲,這一切可從頻譜分析中看到。圖1-14信號(hào)頻譜及波形在諸如調(diào)音臺(tái)等一些數(shù)字處理設(shè)備中,也使用高頻顫動(dòng),不過(guò)在這些情況下,它是作為一個(gè)隨機(jī)數(shù)字序列被引入數(shù)字域的(數(shù)字域白噪聲)。從這一意義上講,它被用于去除由于信號(hào)增益改變而產(chǎn)生的低電平失真,以及在后期制作中進(jìn)行高分辨率到低分辨率的轉(zhuǎn)換的優(yōu)化處理。1.1.6高頻顫動(dòng)的種類主要由Vanderkooy和Lipshitz進(jìn)行的研究已經(jīng)揭示了在高質(zhì)量的聲頻制作中,某種類型的高頻顫動(dòng)要比別的類型有效得多。高頻顫動(dòng)噪聲常根據(jù)其概率分布進(jìn)行歸一化處理,以顯示特定的振幅信號(hào)的概率分布。類似圖1-15所示的一個(gè)簡(jiǎn)單的圖形可用來(lái)說(shuō)明分布的形狀,其中概率是用豎軸表示,而以量化步階反映出的振幅用橫軸表示。圖1-15高頻顫動(dòng)的概率分布曲線只要考慮一下在投骰子時(shí)骰子墜落的方式,就可以理解邏輯概率分布,如圖1-16所示。投一個(gè)骰子存在一個(gè)矩形概率分布函數(shù)(RPDF),因?yàn)閿S出1點(diǎn)和6點(diǎn)之間任一點(diǎn)數(shù)的概率均等(除非骰子已被做了手腳!)。另一方面,一對(duì)小骰子的點(diǎn)數(shù)之和,有一個(gè)近似三角形的概率分布函數(shù)(TPDF),其峰值集中在6~8之間,因?yàn)樾纬蛇@種和值的組合的可能性多于組合成2點(diǎn)或12點(diǎn)的可能性。在數(shù)字電信號(hào)中,我們可用一個(gè)類似于擲骰子的隨機(jī)數(shù)字發(fā)生器產(chǎn)生顫動(dòng),同時(shí)還發(fā)現(xiàn)使用一個(gè)隨機(jī)數(shù)字發(fā)生器可以產(chǎn)生RPDF顫動(dòng),將兩個(gè)RPDF發(fā)生器的輸出相加可以產(chǎn)生TPDF顫動(dòng)。圖1-16擲骰子的概率分布RPDF顫動(dòng)振幅處在零與最大值之間的概率相等,然而TPDF顫動(dòng)振幅為零的概率要大于為最大值的概率。模擬白噪聲具有高斯概率分布,其形狀與任一種邏輯產(chǎn)生的高頻顫動(dòng)相比都稍有不同。Lipshitz和Vanderkooy已經(jīng)證明,RPDF、TPDF以及高斯型高頻顫動(dòng)都具有使轉(zhuǎn)換線性化和去除失真的效果。RPDF顫動(dòng)傾向于在低電平信號(hào)下進(jìn)行噪聲調(diào)制,這就使得他們認(rèn)為最合適的顫動(dòng)噪聲是峰峰值為2Q的TPDF,如圖1-17所示。如果使用RPDF顫動(dòng),它應(yīng)有1Q的峰峰值。圖1-17聲頻信號(hào)最適合加數(shù)字高頻顫動(dòng)信號(hào)有時(shí)候在數(shù)字域可以輕易地產(chǎn)生理想的邏輯概率分布函數(shù),就好像存在于許多轉(zhuǎn)換器的噪聲源將是模擬的一樣,因此本質(zhì)上是高斯分布的。對(duì)于高斯噪聲,顫動(dòng)信號(hào)最合適的均方根振幅為0.5Q,在這種電平下,噪聲調(diào)制被最小化,但并不是沒(méi)有。在該電平下的高頻顫動(dòng)使動(dòng)態(tài)范圍較未加高頻顫動(dòng)時(shí)減小大約6dB,這使得一個(gè)理想的16bit轉(zhuǎn)換器加入高頻顫動(dòng)后的動(dòng)態(tài)范圍為92dB左右。1.1.7A/D轉(zhuǎn)換中的過(guò)采樣過(guò)采樣是指用高于奈奎斯特定理規(guī)定的頻率對(duì)聲頻信號(hào)進(jìn)行采樣。通常在隨后的數(shù)字濾波過(guò)程中,這一高比率被減至為一個(gè)正常比率,以使與通常的采樣信號(hào)相比,不占更多的存儲(chǔ)空間。它是采用采樣分辨率與采樣頻率之間折中的機(jī)制來(lái)工作的,也是建立在一個(gè)通道傳送信息的容量是由這兩個(gè)因素所決定這一理論的基礎(chǔ)之上的。以低分辨率高采樣頻率進(jìn)行采樣可以被轉(zhuǎn)變?yōu)橐暂^高的采樣分辨率較低采樣頻率的采樣,信息不存在任何方面的損失(聲音質(zhì)量)。過(guò)采樣現(xiàn)在已經(jīng)非常流行,廣泛地用于大多數(shù)高質(zhì)量的聲頻轉(zhuǎn)換器中。盡管過(guò)采樣A/D轉(zhuǎn)換器經(jīng)常使用高達(dá)基本頻率44.1kHz和48kHz128倍的采樣頻率進(jìn)行采樣,但轉(zhuǎn)換器數(shù)字輸出的實(shí)際速率并不超過(guò)基本速率。以高速度獲得的采樣被量化成僅僅幾比特的分辨率,隨后再用數(shù)字濾波來(lái)減少采樣頻率,如圖1-18所示。數(shù)字低通濾波器將信號(hào)帶寬限制在1/2基本采樣頻率之內(nèi),以便防止混疊的產(chǎn)生,這是一種抽取濾波器。抽取濾波器靠從過(guò)采樣流中抽取出采樣來(lái)降低采樣速度。低通濾波執(zhí)行的結(jié)果是明顯地增加了采樣的字長(zhǎng),但這種增加不是隨意進(jìn)行的,而是要根據(jù)周圍采樣值,準(zhǔn)確地計(jì)算出每一個(gè)采樣的正確值(見1.4節(jié))。雖然過(guò)采樣轉(zhuǎn)換器最初以低的分辨率對(duì)采樣進(jìn)行量化,但抽取濾波器的輸出卻是具有更高分辨率的,通常以奈奎斯特采樣頻率為采樣的樣本。如果必須的話,采樣分辨率可以減小,以產(chǎn)生所需的字長(zhǎng)。圖1-18過(guò)采樣A/D轉(zhuǎn)換處理的框圖過(guò)采樣帶來(lái)了一些好處,同時(shí)它也是系統(tǒng)在A/D和D/A環(huán)節(jié)能提高音質(zhì)的關(guān)鍵所在。因?yàn)樽畛醯牟蓸宇l率在聲頻范圍之上(通常十或百倍于正常的頻率),從PAM所產(chǎn)生的頻譜分布可以看出,所重復(fù)的頻譜成分已遠(yuǎn)離聲頻頻帶,如圖1-19所示。用在傳統(tǒng)轉(zhuǎn)換器中的模擬抗混疊濾波器被數(shù)字抽取濾波器所代替,如果在D/A轉(zhuǎn)換中過(guò)采樣,那么模擬重建濾波器的滾降就會(huì)更緩。這將改善聲頻頻帶內(nèi)的相位響應(yīng)的特性,從而改善聲音質(zhì)量。過(guò)采樣也使得將“噪聲整形”法引入轉(zhuǎn)換處理成為可能,它可以將量化噪聲的絕大部分轉(zhuǎn)移到頻譜的可聽范圍之外。圖1-19PAM產(chǎn)生的頻譜分布1.1.8A/D轉(zhuǎn)換中的噪聲整形噪聲整形是以增加其他頻帶上噪聲為代價(jià),降低聲頻范圍絕大多數(shù)可聽部分的噪聲的辦法,它使用將量化噪聲的頻譜能量“整形”的處理方式。因?yàn)椴蓸愚D(zhuǎn)換器中使用高的采樣頻率,而且高的采樣頻率將量化噪聲擴(kuò)散到整個(gè)頻率范圍之上,并且大部分處在聲頻范圍之外。量化噪聲能量分布在整個(gè)基帶上,直至奈奎斯特頻率。過(guò)采樣將量化噪聲分布于一個(gè)更寬的頻譜范圍中,因?yàn)樵谶^(guò)采樣的轉(zhuǎn)換器中,奈奎斯特頻率位于聲頻帶的上限之上。它減小了帶內(nèi)噪聲,減小的程度為3dB/oct。換而言之,以兩倍奈奎斯特速率進(jìn)行過(guò)采樣的系統(tǒng)將聲頻頻帶內(nèi)的噪聲能量降低大約3dB。在過(guò)采樣的噪聲整形轉(zhuǎn)換中,積分器(低通濾波器)插在量化器之前,并且在負(fù)反饋環(huán)路中接入一個(gè)D/A轉(zhuǎn)換器,如圖1-20所示,這種轉(zhuǎn)換器稱為“Δ-Σ轉(zhuǎn)換器”。在此不去深入研究這種轉(zhuǎn)換器的原理,我們只需知道其結(jié)果是量化噪聲(在積分器之后引入的)在輸入給抽取濾波器時(shí)對(duì)頻率響應(yīng)進(jìn)行了提升,同時(shí)輸入信號(hào)以平坦的頻響通過(guò)。很顯然,這樣一個(gè)電路和模擬負(fù)反饋電路之間是等效的。圖1-20一個(gè)噪聲整形Δ-ΣA/D轉(zhuǎn)換器的框圖如果沒(méi)有噪聲整形,量化噪聲的能量譜將平滑地延伸至奈奎斯特頻率處,但是有了第一級(jí)噪聲整形,這一能量譜將不再是平直的。如再加上第二級(jí)噪聲整形,帶內(nèi)的噪聲衰減將更加明顯,帶內(nèi)噪聲將明顯小于未經(jīng)噪聲整形處理時(shí)的情況。1.2D/A轉(zhuǎn)換1.2.1基本的D/A轉(zhuǎn)換圖1-21為一個(gè)基本的D/A轉(zhuǎn)換處理示意圖,聲頻樣本值被轉(zhuǎn)化為對(duì)應(yīng)其采樣值的階梯狀電平鏈。在簡(jiǎn)單的轉(zhuǎn)換器中,它通過(guò)比特的狀態(tài)轉(zhuǎn)變成電流源的開和關(guān),并通過(guò)結(jié)合這些電流源的每一個(gè)輸出來(lái)構(gòu)成所需的脈沖振幅。在通過(guò)低通重建濾波器之前,這個(gè)階梯波被“再采樣”以減小脈沖的寬度,濾波器的截止頻率為采樣頻率的1/2。重建濾波器的作用是將采樣點(diǎn)連接起來(lái)形成一個(gè)平滑的波形。再采樣是必須進(jìn)行的,不然的話濾波器的平均效應(yīng)將導(dǎo)致高頻聲音信號(hào)的振幅下降,稱之為“孔徑效應(yīng)”??讖叫?yīng)可以通過(guò)將樣本脈沖寬度限制到大約為采樣周期的1/8來(lái)減小,也可通過(guò)均衡來(lái)校正孔徑效應(yīng)。圖1-21D/A轉(zhuǎn)換中的處理(僅僅顯示了正的樣本值)示意圖1.2.2D/A轉(zhuǎn)換中的過(guò)采樣正如A/D轉(zhuǎn)換中那樣,在D/A轉(zhuǎn)換中也可以使用過(guò)采樣。在D/A轉(zhuǎn)換的情況下,插入的采樣必須處在奈奎斯特速率采樣中間,以使轉(zhuǎn)換可以在較高的采樣速度下進(jìn)行。這些是通過(guò)PCM數(shù)據(jù)的采樣頻率轉(zhuǎn)換來(lái)實(shí)現(xiàn)的。這些樣本隨后以較高的速率轉(zhuǎn)換到模擬狀態(tài),再次避免使用陡峭的模擬濾波器。噪聲整形也可以在D/A轉(zhuǎn)換階段引入,根據(jù)轉(zhuǎn)換器的設(shè)計(jì),來(lái)壓低噪聲的主觀電平。現(xiàn)有的一些先進(jìn)D/A轉(zhuǎn)換器設(shè)計(jì)采用了高速率下的過(guò)采樣,產(chǎn)生僅有幾比特分辨率的樣本。這一方案的極端形式就是極高轉(zhuǎn)換率下的一比特技術(shù)(比特分辨率轉(zhuǎn)換),并采用噪聲整形處理來(lái)優(yōu)化信號(hào)的噪聲頻譜。1.3音質(zhì)與采樣頻率和分辨率之間的關(guān)系1.3.1心理聲學(xué)限制就音質(zhì)而言,數(shù)字聲頻可能已達(dá)到了人耳的聽音極限。然而,粗濫制造的數(shù)字聲頻產(chǎn)品聽起來(lái)也可能非常差,數(shù)字并不是高質(zhì)量的代名詞。采樣參數(shù)和噪聲整形方法的選擇影響著數(shù)字聲頻的頻率響應(yīng)、失真以及動(dòng)態(tài)范圍。人耳的聽覺能力應(yīng)該看作是對(duì)數(shù)字系統(tǒng)評(píng)價(jià)的標(biāo)準(zhǔn),因?yàn)橹挥挟?dāng)失真和噪聲能被聽見才有爭(zhēng)論的必要,所以將轉(zhuǎn)換器的本底噪聲設(shè)計(jì)成低于人耳所能感知的靈敏度應(yīng)該不失為一個(gè)明智之舉。例如,圖1-22顯示的是一個(gè)典型的低電平聽覺靈敏度曲線,它表明了一個(gè)聲音信號(hào)剛剛能被聽到所需要的最低聲壓級(jí)(SPL)??梢钥闯?,人耳在4kHz左右中頻范圍是最靈敏的,而在頻譜的低頻和高頻部分則不是那么靈敏。這條曲線通常稱之為“最低可聞閾”(MAF)或“聽閾”。在1kHz處,其聲壓級(jí)為0dB(基準(zhǔn)聲壓為20μPa)。應(yīng)記住的是,人耳的聞閾不是絕對(duì)的,而是帶概率特性。換句話說(shuō),在試圖判斷什么情況下能被聽見,什么情況下不能被聽見時(shí),實(shí)際上說(shuō)的是一種統(tǒng)計(jì)概率。對(duì)于一些試圖建立聽覺標(biāo)準(zhǔn)的研究來(lái)說(shuō),這是很重要的,因?yàn)槟承╇m然低于聽閾10dB的聲音,在一些情況下存在統(tǒng)計(jì)上確實(shí)能聽到的可能性。圖1-22聽閾曲線動(dòng)態(tài)范圍可以被認(rèn)為是MAF和所能容忍的最響聲音之間的范圍。可容忍的最響聲音因人而異,但是“痛閾”通常被認(rèn)為是在130dB與140dB之間。為此,人耳聽覺的絕對(duì)最大動(dòng)態(tài)范圍在1kHz處大約是140dB,遠(yuǎn)大于在低頻或高頻時(shí)的動(dòng)態(tài)范圍,是否有必要錄制這樣寬的動(dòng)態(tài)范圍還有待討論。LouisFielder和ElizabethCohen所進(jìn)行的一些工作,試圖通過(guò)研究聲源發(fā)出的有效極端聲壓,并且將其與真實(shí)聲學(xué)環(huán)境下的可聞本底噪聲對(duì)比,得出高質(zhì)量數(shù)字聲頻系統(tǒng)所需要的動(dòng)態(tài)范圍。根據(jù)心理聲學(xué)理論,F(xiàn)ielder能夠表示出在不同的頻率下,根據(jù)噪聲與失真的情況可能聽見什么,以及在一個(gè)典型的錄音鏈中,限制的因素可能在哪兒。將動(dòng)態(tài)范圍定義為產(chǎn)生峰值等于一個(gè)特定峰值電平的均方根最大不失真正弦波電平與20kHz限帶白噪聲的均方根電平之比。它與特定聲頻鏈的設(shè)備在無(wú)信號(hào)時(shí)噪聲的響度是一樣的。他進(jìn)一步表明20kHz帶寬噪聲信號(hào)恰好能被聽見的聲壓級(jí)大約為4dB,在滿意的聽音位置上,一些音樂(lè)演奏所達(dá)到的聲壓級(jí)在120dB和129dB之間。根據(jù)這些,他確定了真實(shí)地重放所需要的動(dòng)態(tài)范圍為122dB??紤]到傳聲器的性能和民用揚(yáng)聲器的限制,對(duì)于民用系統(tǒng),所需要的動(dòng)態(tài)范圍降至115dB。1.3.2采樣頻率采樣頻率的選擇決定了最大有效聲頻帶寬。在選擇一個(gè)比必需的采樣頻率低的采樣頻率的問(wèn)題上存在一些爭(zhēng)議。經(jīng)常爭(zhēng)論的是從有用的最高聲頻頻率為多少這個(gè)問(wèn)題上開始的,同時(shí)這也是爭(zhēng)論的焦點(diǎn)所在。傳統(tǒng)的理論認(rèn)為聲頻頻帶伸展至20kHz,這意味著對(duì)高質(zhì)量的聲頻制作而言,采樣頻率只需超過(guò)40kHz即可。事實(shí)上,有兩個(gè)標(biāo)準(zhǔn)的采樣頻率位于40kHz和50kHz之間:CD的采樣頻率為44.1kHz,而稱之為“專業(yè)”的采樣頻率為48kHz。這兩者都滿足1984年制定的數(shù)字聲頻設(shè)備采樣頻率的AES5標(biāo)準(zhǔn)。表1-1列出了各種不同的采樣頻率以及它們的應(yīng)用范圍。在臺(tái)式PC和聲卡中使用的采樣頻率標(biāo)準(zhǔn)很多,這里只列出了其中最通用的。表1-1通常采用的采樣頻率首先是48kHz的采樣頻率,因?yàn)樗o磁帶錄音機(jī)向下變速處理留有大量余地。當(dāng)許多數(shù)字錄音機(jī)變換速度時(shí),它們的采樣頻率也相應(yīng)地改變,其結(jié)果為聲頻基帶第一個(gè)頻譜副本產(chǎn)生移動(dòng)。如果采樣頻率被降得太低,那么會(huì)聽到混疊成分。為此,大多數(shù)專業(yè)的數(shù)字磁帶錄音機(jī)僅允許有±12.5%的速度變化。然而,現(xiàn)在通過(guò)使用截止頻率隨采樣頻率變化的低通濾波器可以防止這個(gè)問(wèn)題的產(chǎn)生。在民用CD機(jī)上,較早地采用了44.1kHz的采樣頻率,如今這一頻率已被廣泛使用。實(shí)際上,它也已經(jīng)成為大多數(shù)專業(yè)錄音設(shè)備中備選的采樣頻率之一。它允許20kHz聲頻頻帶的全部使用,并且過(guò)采樣轉(zhuǎn)換器允許使用可以防止在高頻出現(xiàn)相位問(wèn)題的較緩的模擬抗混疊濾波器。與48kHz的采樣頻率相比,它每秒鐘所產(chǎn)生的數(shù)據(jù)要少10%,從存儲(chǔ)的觀點(diǎn)來(lái)看要經(jīng)濟(jì)一些。IMARP速率在國(guó)際多媒體協(xié)會(huì)推薦使用中被挑選來(lái)提高多媒體系統(tǒng)中的數(shù)字聲頻兼容性,用來(lái)在工作站中交換聲音文件。32kHz的采樣頻率使用在一些廣播應(yīng)用上,例如在NICAM728立體聲電視傳送以及用在一些無(wú)線電轉(zhuǎn)播系統(tǒng)中。電視和FM廣播聲音帶寬被限制在15kHz已經(jīng)好多年,并且靠使用這一較低的采樣頻率達(dá)到了節(jié)省傳送帶寬的目的。大多數(shù)重要的聲頻信息都位于15kHz以下,并且除去15kHz以上的頻率成分對(duì)聲音的影響也不太大。一些專業(yè)的聲頻設(shè)備將這一頻率作為備選。例如一些DAT使用這一頻率來(lái)進(jìn)行長(zhǎng)時(shí)間播放。更高的采樣頻率,如88.2kHz和96kHz作為標(biāo)準(zhǔn)存在的依據(jù)是要適合聲源的要求:即高于20kHz的信息對(duì)于聲音質(zhì)量也是重要的。一位日本教授已經(jīng)揭示出,高于20kHz的頻率能夠使人腦中X波興奮。這個(gè)X波與人的滿足和放松的狀態(tài)相對(duì)應(yīng)。人耳的聽覺響應(yīng)并不是截止于20kHz的觀點(diǎn)顯然是正確的,但是只有極少數(shù)聽音者可以屢次區(qū)分出一個(gè)信號(hào)是否含有較高的頻率成分。采樣頻率加倍將導(dǎo)致數(shù)字聲頻系統(tǒng)的數(shù)據(jù)率加倍,從而使可存儲(chǔ)的時(shí)間減半。這些較高的采樣頻率應(yīng)在仔細(xì)權(quán)衡過(guò)得失之后再選用。當(dāng)前還沒(méi)有支持這些頻率的民用重放媒體。那些低于30kHz的低采樣頻率經(jīng)常用于對(duì)音質(zhì)要求較低的PC工作站上,如存儲(chǔ)語(yǔ)言樣本、內(nèi)置音效源等。在早期的計(jì)算機(jī)中,這些是由于時(shí)鐘和運(yùn)算速度限制造成的。多媒體應(yīng)用可能需要支持這些頻率,因?yàn)樵谶@類應(yīng)用中,經(jīng)常用到各種不同質(zhì)量的聲音。1.3.3量化分辨率每個(gè)樣本的比特?cái)?shù)決定著數(shù)字聲頻系統(tǒng)的信噪比或動(dòng)態(tài)范圍。在此僅討論線性PCM系統(tǒng),因?yàn)閷?duì)于所介紹的非線性量化或數(shù)據(jù)壓縮,情況是不同的。表1-2簡(jiǎn)要地表述了不同采樣分辨率的應(yīng)用。表1-2線性量化分辨率多年來(lái),16bit線性PCM已被認(rèn)為是高質(zhì)量聲頻應(yīng)用的規(guī)范。這是CD標(biāo)準(zhǔn)的音質(zhì),并且能夠提供超過(guò)90dB的動(dòng)態(tài)范圍。對(duì)于大多數(shù)的應(yīng)用而言,雖然已經(jīng)足夠,但是還不能達(dá)到Fielder的理想,即在專業(yè)系統(tǒng)中進(jìn)行122dB無(wú)噪聲重放的要求。要達(dá)到如此之大的動(dòng)態(tài)范圍需要轉(zhuǎn)換器的分辨率為21bit左右,根據(jù)對(duì)這一指標(biāo)的注釋,今天的轉(zhuǎn)換器技術(shù)可以達(dá)到這一要求。有些設(shè)計(jì)方案采用兩個(gè)轉(zhuǎn)換器,靠數(shù)字信號(hào)處理來(lái)將有重疊的兩個(gè)輸出混合起來(lái),使可聞的動(dòng)態(tài)范圍明顯提高。而另一些則使用非相關(guān)高頻顫動(dòng)的兩個(gè)轉(zhuǎn)換器,將它們的輸出相加,而使信號(hào)增加6dB,而噪聲只增加3dB。在專業(yè)錄音中會(huì)常常遇到需要一定的“峰值儲(chǔ)備”的情況。換句話說(shuō),一些用于不可預(yù)見的情況下的超過(guò)標(biāo)稱峰值錄音電平的動(dòng)態(tài)范圍,如當(dāng)一個(gè)信號(hào)過(guò)沖,超出其預(yù)期的電平。尤其是現(xiàn)場(chǎng)錄音時(shí),不知道錄音電平會(huì)出現(xiàn)什么樣的情況時(shí)更是必需。這就是為什么許多專業(yè)人士認(rèn)為高于16bit的分辨率對(duì)于原始錄音很有必要的另一個(gè)原因。為此,20bit錄音格式迅速地流行起來(lái),調(diào)音師也可以使用噪聲整形再量化處理來(lái)完善已制作完成的16bit媒質(zhì)的錄音(例如CD)。人們甚至已經(jīng)開始對(duì)24bit錄音感興趣了,但目前能全面開發(fā)這一動(dòng)態(tài)范圍的轉(zhuǎn)換技術(shù)尚不成熟。在較低質(zhì)量的終端產(chǎn)品中,一些PC的聲卡以及內(nèi)部聲源以低至4bit的分辨率進(jìn)行工作。在臺(tái)式計(jì)算機(jī)中,8bit的采樣重放輸出是最常見的,它通過(guò)PC的內(nèi)置揚(yáng)聲器重放出中等的音質(zhì),在未加高頻顫動(dòng)時(shí)的動(dòng)態(tài)范圍大約為50dB。有許多適用于PC的非線性量化方案,PC中采用了多種非線性量化方案,比如A律和μ律以及各種其他數(shù)據(jù)壓縮方案。這些方案能夠通過(guò)少量的比特?cái)?shù)來(lái)改善動(dòng)態(tài)范圍,但也存在著可聞的副作用。國(guó)際多媒體協(xié)會(huì)已經(jīng)制定并推薦了便于簡(jiǎn)單交換的一系列采樣頻率和數(shù)據(jù)類型,如表1-3所示。當(dāng)今的多媒體PC和聲卡通常以16bit分辨率作為標(biāo)準(zhǔn)。一些早期的MIDI采樣器以8bit分辨率進(jìn)行工作,近期多為12bit,而現(xiàn)在的MIDI采樣器則普遍具備真正16bit的分辨率。表1-3國(guó)際多媒體協(xié)會(huì)為計(jì)算機(jī)之間基本聲頻數(shù)據(jù)互換推薦的采樣頻率和量化1.4數(shù)字化處理的相關(guān)問(wèn)題1.4.1時(shí)基抖動(dòng)及對(duì)轉(zhuǎn)換器的影響時(shí)基抖動(dòng)是聲頻樣本時(shí)基位置的短時(shí)間變化。理想情況下它們應(yīng)該是非常穩(wěn)定的,如果時(shí)基不穩(wěn),各種有害的影響將在聲音質(zhì)量上反映出來(lái),包括附加的噪聲和失真,它由樣本瞬間時(shí)基偏移的方式而定。抖動(dòng)被認(rèn)為與量化誤差非常類似,只不過(guò)時(shí)間軸在這里替代了振幅軸,但它們的結(jié)果是類似的。它是由多種原因造成的,其中包括低質(zhì)量的時(shí)鐘信號(hào)、電子噪聲、電子干擾,也經(jīng)常是由于通過(guò)數(shù)字接口傳遞聲頻信號(hào)造成的。注意到抖動(dòng)并非必定是一個(gè)問(wèn)題是很重要的。只有影響進(jìn)行A/D和D/A轉(zhuǎn)換中的時(shí)鐘時(shí)才對(duì)聲音質(zhì)量有所影響,在很多情況下可以通過(guò)使用合適的穩(wěn)定的鎖相環(huán)路進(jìn)行重復(fù)再生時(shí)鐘而將抖動(dòng)去除。A/D轉(zhuǎn)換器時(shí)鐘上的抖動(dòng)如不能隨后被去除的話,會(huì)產(chǎn)生信號(hào)的永久失真。而在數(shù)字域后面的階段引入的抖動(dòng)可以被減少或去除。抖動(dòng)的重要特征表現(xiàn)在峰值振幅和其速率上,這兩個(gè)因素相結(jié)合將會(huì)影響聲音質(zhì)量。Shelton通過(guò)計(jì)算隨機(jī)抖動(dòng)的均方根信噪比得出結(jié)論:低于5ns的時(shí)基不規(guī)則變化,對(duì)于整個(gè)信號(hào)頻率范圍上的16bit數(shù)字聲頻系統(tǒng)可能是非同小可的。這一要求在更高的分辨率以及在高頻情況下將更加苛刻。圖1-23簡(jiǎn)要地表示了這些影響。圖1-23不同頻率下采樣時(shí)鐘抖動(dòng)對(duì)信噪比的影響如果抖動(dòng)是周期性的而非隨機(jī)產(chǎn)生的,其結(jié)果將相當(dāng)于“抖動(dòng)”,如果在一個(gè)正弦聲頻信號(hào)轉(zhuǎn)化的采樣時(shí)鐘中發(fā)生這種情況,那么由于相位調(diào)制會(huì)在原始聲頻信號(hào)兩邊產(chǎn)生邊帶,其頻率間隔等同于抖動(dòng)頻率。JulianDum已經(jīng)得出抖動(dòng)邊帶(Rj)的電平與信號(hào)的關(guān)系,可以表示為:Rj(dB)=20lg(Jωi/4)這里J是指抖動(dòng)的峰峰值振幅,ωi是指聲頻信號(hào)頻率。根據(jù)這個(gè)公式,他提出對(duì)于一個(gè)振幅為500ps的抖動(dòng),一個(gè)最高電平的20kHz的聲頻信號(hào)將產(chǎn)生一個(gè)相對(duì)主音振幅的96.1dB邊帶。然而,最重要的是“抖動(dòng)引發(fā)的”產(chǎn)物的聽覺效果。Dum試圖在利用心理聲學(xué)理論對(duì)最終頻譜分析的基礎(chǔ)上進(jìn)行計(jì)算。假定聲頻信號(hào)是在一個(gè)高聲壓級(jí)的情況下進(jìn)行重放(120dB聲壓級(jí)),則圖1-24繪出了抖動(dòng)振幅相對(duì)于抖動(dòng)頻率的變化情況(不是聲頻頻率),以便在最壞聲頻信號(hào)情況下,剛剛能聽見調(diào)制噪聲。圖1-24抖動(dòng)振幅相對(duì)于抖動(dòng)頻率的變化情況1.4.2改變聲頻信號(hào)的分辨率(再量化)當(dāng)需要改變信號(hào)的分辨率時(shí),在聲頻制作中可能會(huì)有一些關(guān)鍵的問(wèn)題出現(xiàn)。在高質(zhì)量的聲頻中,這一情況最普通的例子是從20bit錄音中制作CD母版,因?yàn)镃D只有16bit的分辨率。此情況也發(fā)生在所有形式的信號(hào)處理器中,因?yàn)闃颖镜淖珠L(zhǎng)在不同的階段有所不同。在多媒體應(yīng)用中,需要將聲音文件從16bit轉(zhuǎn)換成8bit分辨率的情況是常有的,這一操作執(zhí)行的正確與否也是非常重要的。如果聲頻樣本的長(zhǎng)度需要減少,那么簡(jiǎn)單地舍去不想要的LSB可能是最差的解決方法。例如將20bit的信號(hào)減少為16bit,不能簡(jiǎn)單地舍去4位LSB就認(rèn)為萬(wàn)事大吉了。舍去LSB可能會(huì)產(chǎn)生與在A/D轉(zhuǎn)換中不使用高頻顫動(dòng)相似的結(jié)果,即有可能引入低電平的失真成分。低電平的信號(hào)聽起來(lái)會(huì)有顆粒感,同時(shí)也無(wú)法平滑地衰減成噪聲。對(duì)這一問(wèn)題正確的解決方式是靠在數(shù)字域增加顫動(dòng)噪聲來(lái)對(duì)信號(hào)進(jìn)行再次顫動(dòng),以達(dá)到既定的分辨率。為這一新的分辨率而進(jìn)行的數(shù)字抖動(dòng)應(yīng)該控制在合適的電平上,并且新樣本的LSB增加或減少應(yīng)該由該拋棄的LSB總值來(lái)決定。應(yīng)該注意到,許多廉價(jià)的數(shù)字聲頻設(shè)備都無(wú)法圓滿地進(jìn)行這一操作(尤其在16bit至8bit的再量化中),導(dǎo)致了音質(zhì)下降。許多專業(yè)級(jí)的數(shù)字聲頻工作站都允許以各種不同的分辨率對(duì)聲音進(jìn)行存儲(chǔ)和輸出,也可以讓用戶來(lái)選擇是否加高頻顫動(dòng)。例如,將20bit錄音的聲音制作成CD母版,要確保原始錄音中最高電平的信號(hào)在制作母版時(shí)被調(diào)整,以便在16bit分辨率情況下進(jìn)行再量化與再顫動(dòng)之前,可以使其峰值盡可能地接近最高電平。以這種方式,可以盡可能最大限度地將原始信號(hào)的低電平信息保存下來(lái),同時(shí)使量化噪聲最小。不僅在CD母版制作上,在許多再量化處理時(shí),都運(yùn)用這一方法。許多應(yīng)用使用了自動(dòng)度量聲頻信號(hào)的方法,因?yàn)檫@樣可以對(duì)電平進(jìn)行最佳的調(diào)整,允許用戶將峰值電平值設(shè)置在樣本最高電平處。由于數(shù)字儀表和CD母版制作系統(tǒng)上的許多過(guò)載檢測(cè)器可以找到最高電平重復(fù)的樣本并檢測(cè)是否過(guò)載,設(shè)置峰值電平是一個(gè)明智的做法,這樣可以使信號(hào)恰好處于滿調(diào)制工作之下。這將確保原版磁帶不會(huì)因?yàn)閺?fù)制工廠懷疑錄制錯(cuò)誤而拒絕生產(chǎn),同樣用戶也不會(huì)因電平過(guò)載而抱怨。1.4.3動(dòng)態(tài)范圍擴(kuò)展如上所述,在再量化的過(guò)程中,最大限度地提高數(shù)字聲頻信號(hào)的主觀動(dòng)態(tài)范圍是可以實(shí)現(xiàn)的。這在將高分辨率的錄音制作成CD母版時(shí)尤其有用,因?yàn)闇p少為16bit的字長(zhǎng)通常會(huì)引起量化噪聲增加。盡管它被轉(zhuǎn)移至一個(gè)16bit的媒體中,但保留高分辨率錄音絕大部分的動(dòng)態(tài)范圍實(shí)際上還是可以實(shí)現(xiàn)的。在再量化中,使用數(shù)字濾波來(lái)對(duì)量化噪聲的頻譜進(jìn)行整形,以便將盡可能多的量化噪聲轉(zhuǎn)移到最難以聽到的頻譜中。通常,它將噪聲從人耳最靈敏的4kHz區(qū)域移開,將移開的噪聲加到頻譜的高端。結(jié)果,通常是高電平的噪聲分布在高頻區(qū),但仍然位于聽閾之下。使用這種方法,CD聽起來(lái)幾乎可以達(dá)到與20bit錄音相同的動(dòng)態(tài)范圍。1.4.4誤碼校正盡管專門的數(shù)字錄音格式需要專門設(shè)計(jì)的系統(tǒng)來(lái)糾正數(shù)據(jù)錯(cuò)誤帶來(lái)的影響,但是,那些使用計(jì)算大容量主存儲(chǔ)媒質(zhì)的系統(tǒng)就并非如此了。原因在于這些大容量存儲(chǔ)媒介被格式化了,這種格式化可以保證基本不會(huì)出現(xiàn)誤碼。比如說(shuō),當(dāng)一個(gè)計(jì)算機(jī)磁盤驅(qū)動(dòng)器在一個(gè)較低的水平下被格式化,格式化的目的就是將數(shù)據(jù)寫進(jìn)每一個(gè)地址并且可讀取出來(lái)。如果一個(gè)地址被認(rèn)為是被損壞了,或者產(chǎn)生了錯(cuò)誤的重放,那么它就被認(rèn)為是“壞區(qū)”,這樣它就不再用來(lái)進(jìn)行數(shù)據(jù)存儲(chǔ)。此外,磁盤和磁帶驅(qū)動(dòng)器進(jìn)行誤碼行自檢,并且通過(guò)使用那些通常對(duì)數(shù)字聲頻系統(tǒng)透明的方法來(lái)糾錯(cuò)。在讀取數(shù)據(jù)時(shí)如果檢測(cè)到一個(gè)數(shù)據(jù)錯(cuò)誤,那么此后該數(shù)據(jù)塊通常被數(shù)次地重讀,以判斷數(shù)據(jù)能否被恢復(fù)。這樣唯一的影響就是交換的速度降低了一些。這與專門的聲頻格式,如DAT的情況截然不同。在專門的聲頻格式中,有許多層誤碼保護(hù),其中一些可將誤碼徹底糾正(對(duì)音質(zhì)毫無(wú)影響),而另一些則使得嚴(yán)重的誤碼在聽感上造成的影響降至最低,這一處理稱之為內(nèi)插。例如,可根據(jù)周圍樣本的電平來(lái)判斷丟失的樣本值為多少,如圖1-25所示。另一方面,計(jì)算機(jī)系統(tǒng)不允許采用這種誤碼校正,因?yàn)樗俣〝?shù)據(jù)要么是正確的,要么就是無(wú)用的。例如,在讀財(cái)務(wù)報(bào)表時(shí),僅憑觀察一個(gè)未知點(diǎn)兩邊的值而對(duì)其進(jìn)行猜測(cè)是不允許的。圖1-25插入可將丟失樣本所產(chǎn)生的可聞?dòng)绊戨[蔽掉因此,計(jì)算機(jī)大容量存儲(chǔ)媒質(zhì)上的數(shù)據(jù)被認(rèn)為是原始數(shù)據(jù)。無(wú)誤碼數(shù)據(jù)存儲(chǔ)一旦被格式化,就沒(méi)有再增加糾錯(cuò)數(shù)據(jù)的必要。這并不是說(shuō)這種媒質(zhì)絕不出錯(cuò),因?yàn)樗鼈儠r(shí)常會(huì)有錯(cuò)誤發(fā)生,但是數(shù)字聲頻工作站通常并不在那些已經(jīng)存儲(chǔ)的數(shù)字上再采取任何額外的誤碼。這樣的結(jié)果就是,如果無(wú)法避免的錯(cuò)誤在數(shù)字聲頻工作站重放聲音文件時(shí)出現(xiàn)的話,那么它通常會(huì)導(dǎo)致整個(gè)文件無(wú)法播放。這一文件將被認(rèn)為是損壞的,計(jì)算機(jī)將無(wú)法讀取它。用戶沒(méi)有能夠決定錯(cuò)誤是否可聞的權(quán)利,他必須借助某種計(jì)算機(jī)文件“急救包”幫助——“急救包”使用各種專門的技術(shù)來(lái)試圖恢復(fù)被破壞的信息。1.5數(shù)字聲頻信號(hào)處理在模擬域?qū)β曨l信號(hào)進(jìn)行的諸如均衡、推拉衰減和壓縮等處理工作,在數(shù)字域同樣可以進(jìn)行,而且,在數(shù)字域進(jìn)行某些操作時(shí)其副作用更?。ㄈ缦辔皇д妫绕涫窃谀M域?qū)崿F(xiàn)非常困難或者根本就不可能實(shí)現(xiàn)的一些功能在數(shù)字域則是可以實(shí)現(xiàn)的。這里,僅就數(shù)字聲頻信號(hào)處理的相關(guān)問(wèn)題簡(jiǎn)介如下。1.5.1電平控制在數(shù)字域中,改變聲音信號(hào)的電平相對(duì)要容易一些。將增益改變6dB是最容易的,因?yàn)檫@意味著只需將整個(gè)樣本字節(jié)向左或向右移動(dòng)一步,如圖1-26所示。實(shí)際上,這個(gè)操作是將初始值乘以2或除以2。更精確的增益控制則是用一些其他表示增益增減的因子,乘以聲頻樣本值來(lái)實(shí)現(xiàn)的。乘數(shù)中的比特?cái)?shù)決定了增益調(diào)節(jié)的精度。將兩個(gè)二進(jìn)制數(shù)相乘可以產(chǎn)生一個(gè)比初始值有更多比特位的新樣本值,并且數(shù)字調(diào)音臺(tái)內(nèi)部結(jié)構(gòu)具備處理32bit字長(zhǎng)的能力已經(jīng)是非常普遍的,盡管在它們的輸入和輸出部分只能處理20bit。正因?yàn)槿绱?,在調(diào)音臺(tái)采樣分辨率已被降低的地方,普遍使用再顫動(dòng)處理,例如在所有數(shù)字輸出或轉(zhuǎn)換階段,以便保持如上所述的音質(zhì)。圖1-26通過(guò)將所有比特向左或向右移一步樣本增益可改變6dB在數(shù)字增益控制中用作乘數(shù)的數(shù)值可以由用戶控制產(chǎn)生,如推拉衰減器、旋轉(zhuǎn)電位器或屏幕指示等,或者也可以由自動(dòng)化系統(tǒng)中存儲(chǔ)的值得來(lái)。從一個(gè)“模擬”推拉衰減器得到一個(gè)數(shù)字值的“經(jīng)典”方式是將推拉衰減器與一個(gè)固定的電壓源接起來(lái),將衰減器滑動(dòng)點(diǎn)接到A/D轉(zhuǎn)換器上,以提供一個(gè)與它們的位置有關(guān)的直接二進(jìn)制位置輸出的控制能力。衰減器的“規(guī)則”(其增益與其本身的物理位置相關(guān))可以由在存儲(chǔ)器中建立的一個(gè)合適的檢查表的值來(lái)決定,它將被作為對(duì)應(yīng)衰減器自身位置的乘數(shù)來(lái)使用。1.5.2交叉漸變?cè)谑褂脭?shù)字聲頻工作站時(shí),一部分的聲音要與另一部分(編輯點(diǎn))連接的地方廣泛地使用交叉漸變技術(shù)。它可以避免因波形突變而產(chǎn)生的“咔嗒”聲,同時(shí)也使一個(gè)聲音平滑地過(guò)渡到另一個(gè)聲音上。在圖1-27中給出了這一處理的原理框圖。它是指兩個(gè)分別受其自動(dòng)推拉衰減器控制的信號(hào)(二進(jìn)制相乘),一個(gè)衰減一個(gè)提升,繼而將兩個(gè)信號(hào)相加,以控制衰減器的速率和系數(shù),產(chǎn)生各種不同形式的交叉漸變。圖1-27交叉漸變?cè)砜驁D1.5.3調(diào)音調(diào)音是指將代表不同聲道的獨(dú)立的數(shù)據(jù)流合成在一起,將來(lái)自每個(gè)輸入聲道的同一時(shí)刻的樣本相加產(chǎn)生一個(gè)單獨(dú)輸出聲道的樣本。通過(guò)將不同輸入相加而獲得大量的不同輸出通道,便可以有許多條混合“母線”。信號(hào)相加的結(jié)果是明顯增加了總體的電平。由于存在這種可能性,所以調(diào)音臺(tái)的結(jié)構(gòu)必須允許更大的峰值儲(chǔ)備,才能達(dá)到和模擬混音臺(tái)相同的效果。1.5.4數(shù)字濾波器和均衡數(shù)字濾波器可以看成是一個(gè)“百寶箱”,它經(jīng)常用來(lái)描述并非首次出現(xiàn)于濾波中的數(shù)字信號(hào)處理工作。數(shù)字濾波器實(shí)質(zhì)上是一個(gè)處理過(guò)程,它包括各種形式,從最簡(jiǎn)單到最復(fù)雜的時(shí)間延遲,相乘或聲頻樣本重組的過(guò)程。利用數(shù)字濾波器可以構(gòu)成低通和高通濾波器,峰值和擱架形濾波器,回聲和混響效果,甚至用可調(diào)整特征的自適應(yīng)濾波器對(duì)信號(hào)的不同部分產(chǎn)生作用。理解數(shù)字濾波器的基本原理有利于掌握為什么可以用數(shù)字形式來(lái)模擬某種模擬濾波處理。濾波器響應(yīng)可以以兩種主要的方式模型化,一是根據(jù)它們的頻率域響應(yīng),二是看它們的時(shí)間域響應(yīng)(也有其他方法,稱為Z平面轉(zhuǎn)換,這里不再提及)。頻率域響應(yīng)顯示了濾波器的輸出振幅如何隨著頻率變化而改變,而時(shí)間域則通常以一個(gè)脈沖響應(yīng)的形式來(lái)表示,如圖1-28所示。因?yàn)閮烧唛g直接相關(guān),所以每個(gè)頻率響應(yīng)都對(duì)應(yīng)一個(gè)脈沖響應(yīng)。如果改變了濾波器在時(shí)間域上的響應(yīng),那么它在頻率域上的響應(yīng)也隨之改變。將時(shí)間域上的響應(yīng)轉(zhuǎn)換成對(duì)應(yīng)的頻率域響應(yīng)的方法,就是我們常用的傅里葉變換。時(shí)間域和頻率域上的響應(yīng)是我們考查同一事物的兩種方法。數(shù)字聲頻信號(hào)是采樣得來(lái)的,故在時(shí)間上是離散的,每個(gè)樣本代表著聲波在某一時(shí)刻的幅度值,所以要借助時(shí)間域上聲頻樣本的運(yùn)算來(lái)獲得數(shù)字濾波的某種特性。事實(shí)上,如果想用數(shù)字形式來(lái)模擬某一模擬濾波器的特性,那么必須要分析其脈沖響應(yīng),并且在數(shù)字域?qū)⑵淠P突?。?shù)字形式的濾波器應(yīng)該與模擬形式的濾波器有同樣的頻率響應(yīng),并且人們甚至能預(yù)測(cè)出用于數(shù)字聲頻工作站中實(shí)用的模擬濾波器的可能性,但問(wèn)題是如何生成數(shù)字化的特定脈沖響應(yīng)特性,并且如何將其與聲頻數(shù)據(jù)結(jié)合在一起。圖1-28簡(jiǎn)單濾波器的頻率響應(yīng)及對(duì)應(yīng)的時(shí)間域脈沖響應(yīng)上面已提到,所有的數(shù)字濾波器都可以實(shí)現(xiàn)聲頻樣本的延時(shí)、相乘和重組,并且可以將這些元素有機(jī)地安排,以取得濾波器的脈沖響應(yīng)。一種簡(jiǎn)單的濾波器模型就是有限脈沖響應(yīng)(FIR)濾波器或橫向?yàn)V波器,如圖1-29所示。由圖中看到,這種濾波器是由帶抽頭的延時(shí)線組成的,其中每個(gè)抽頭的輸出在與其他抽頭的輸出相加之前,要乘上一個(gè)確定的系數(shù)。當(dāng)輸入的脈沖到來(lái)時(shí),將會(huì)產(chǎn)生一系列獨(dú)立的脈沖,它們?cè)谳敵龆讼嗉虞敵?。之所以將它稱為FIR濾波器,是因?yàn)檩斎攵说囊粋€(gè)脈沖導(dǎo)致了有限的輸出序列,這些輸出序列是由抽頭的數(shù)目決定的。抽頭數(shù)目越多,則濾波器的響應(yīng)就越復(fù)雜,但簡(jiǎn)單的低通濾波器僅需幾個(gè)抽頭。圖1-29簡(jiǎn)單的FIR濾波器(橫向?yàn)V波器)另外一種主要的類型是無(wú)限脈沖響應(yīng)(IIR)濾波器,也稱為遞歸濾波器,在輸出和輸入之間存在一級(jí)反饋,如圖1-30所示。因?yàn)榇嬖谥答?,所以這種濾波器對(duì)單一脈沖的響應(yīng)是無(wú)限長(zhǎng)的輸出序列。由于對(duì)于大多數(shù)可變的均衡器,IIR濾波器比相應(yīng)的FIR濾波器所用的單元要少得多,所以聲頻設(shè)備常常采用IIR濾波器,效果設(shè)備也使用IIR濾波器。但不幸的是,IIR濾波器的相位響應(yīng)是非線性的,而FIR濾波器具有線性的相位響應(yīng)。圖1-30簡(jiǎn)單的IIR濾波器(遞歸濾波器)1.5.5數(shù)字混響和其他效果一個(gè)典型反射房間的脈沖響應(yīng)如圖1-31所示。首先是由聲源而來(lái)的直達(dá)聲,隨后是一些早期反射聲,然后是一些擴(kuò)散的高密度反射聲,它逐漸衰減至無(wú)聲。使用一些IIR濾波器,或許再加上一些FIR濾波器,可以產(chǎn)生合適的延時(shí)型和初始脈沖的衰減型,模仿出一個(gè)房間的衰減模型。通過(guò)修正早期反射設(shè)計(jì)的延遲與振幅,以及擴(kuò)散分布特性,可以模仿出各種不同的房間。圖1-31一個(gè)典型反射房間的脈沖響應(yīng)設(shè)計(jì)一個(gè)使人信服的混響算法是一個(gè)需要技巧的工作,未經(jīng)雕琢的方案和一個(gè)優(yōu)秀的方案之間的差別是非常明顯的。一些聲頻工作站通過(guò)基本的軟件包提供有限的混響效果,但是聽起來(lái)這些效果很差,因?yàn)閿?shù)字信號(hào)處理(DSP)能力有限,算法也不先進(jìn)。一些設(shè)備或插卡可供工作站使用,它們具有強(qiáng)大的DSP能力和分立的處理軟件。還有一些簡(jiǎn)單的效果也可以在不占用太多DSP能力的情況下引入,例如跟蹤加倍和相位/鑲邊效果。這些效果通常僅采用非常簡(jiǎn)單的延遲和再結(jié)合處理。音調(diào)轉(zhuǎn)換也可以由數(shù)字完成,它采用的處理類似于下面所說(shuō)的采樣頻率轉(zhuǎn)換。由于需要大量的計(jì)算,所以高質(zhì)量的音調(diào)轉(zhuǎn)換需要相當(dāng)強(qiáng)的處理能力。1.5.6動(dòng)態(tài)處理數(shù)字動(dòng)態(tài)處理包括聲頻信號(hào)瞬時(shí)電平所進(jìn)行的增益控制,其框圖如圖1-32所示。旁鏈產(chǎn)生對(duì)應(yīng)瞬時(shí)增益改變所需要的系數(shù),它隨后用來(lái)與延遲的聲頻樣本相乘。首先必須產(chǎn)生信號(hào)的均方根電平,隨后它需要轉(zhuǎn)換成一個(gè)對(duì)數(shù)值,以便以分貝來(lái)表示電平的改變。因只有超過(guò)某一特定閾值的電平將受影響,所以所得到的值必須加上一個(gè)常數(shù)因子,之后它們乘上一個(gè)表示壓縮斜率的系數(shù)表示壓縮。系數(shù)值隨后經(jīng)反對(duì)數(shù)運(yùn)算變成線性系數(shù),用它與聲頻樣本相乘。圖1-32一個(gè)簡(jiǎn)單的數(shù)字動(dòng)態(tài)處理操作1.5.7采樣頻率轉(zhuǎn)換聲音在以不同采樣頻率進(jìn)行操作的系統(tǒng)之間交換時(shí),采樣頻率轉(zhuǎn)換是必需的。其目標(biāo)是在不改變音調(diào)或增加失真與噪聲的前提下將聲音轉(zhuǎn)化成新的采樣頻率。如今采樣頻率轉(zhuǎn)換可以是非常高質(zhì)量的處理,盡管它從來(lái)就不是一個(gè)透明的處理,因?yàn)樗ㄖ鴮?duì)樣本值和時(shí)基的修正。由于有再量化算法,所以在價(jià)格較低的數(shù)字聲頻工作站中遇到質(zhì)量較差的采樣頻率轉(zhuǎn)換的情況是常有的事,通常這更取決于專門的應(yīng)用軟件,而非所用的硬件。從一個(gè)速率轉(zhuǎn)換至另一個(gè)速率最簡(jiǎn)單的方法是先變成模擬域,然后以新的采樣頻率進(jìn)行再采樣,但這有可能會(huì)引入少量額外的噪聲。數(shù)字采樣頻率轉(zhuǎn)換最基本的形式是指由一個(gè)固定的采樣頻率轉(zhuǎn)換至另一個(gè)固定的采樣頻率,兩個(gè)采樣頻率之間有簡(jiǎn)單的分?jǐn)?shù)比率關(guān)系。這就是為什么建議50.4kHz應(yīng)該是新的專業(yè)采樣頻率的原因所在,因?yàn)樗c44.1kHz有8/7的比例關(guān)系。后來(lái),48kHz被選為廣播使用的專業(yè)錄音采樣頻率,是因?yàn)樗c32kHz有一個(gè)簡(jiǎn)單的比例關(guān)系。分?jǐn)?shù)比例轉(zhuǎn)換是指使原采樣頻率下的采樣值通過(guò)數(shù)學(xué)計(jì)算得出新采樣頻率下的樣本值。數(shù)字濾波器被用來(lái)計(jì)算出新的樣本的幅度,以便能根據(jù)原始樣本的脈沖響應(yīng),在采用低通濾除原來(lái)采樣頻率的奈奎斯特頻率上限成分之后,在原來(lái)兩個(gè)采樣頻率共用一個(gè)時(shí)鐘頻率來(lái)進(jìn)行內(nèi)插的控制。使用這一方法,有些輸出樣本將與輸入樣本發(fā)生重復(fù),但是只有少量的可能插在輸入和輸出樣本間。如果輸入與輸出采樣頻率之間有個(gè)可變的或非單一的關(guān)系,那么上面的結(jié)論將不成立,因?yàn)樵谳斎霕颖局g的任何間隔處可能需要輸出樣本。這需要內(nèi)插器有比分?jǐn)?shù)比轉(zhuǎn)換更多的時(shí)鐘相位,目的是選擇一個(gè)與所需要的瞬時(shí)輸出樣本關(guān)系最近的時(shí)鐘相位,以此計(jì)算出必要的系數(shù)。這顯然是一個(gè)誤差。不過(guò),它可用增加內(nèi)插器相位的數(shù)目來(lái)減少。時(shí)基誤差反映在聽感上的效果等同于在聲頻信號(hào)抖動(dòng)的效果,所以應(yīng)該在設(shè)計(jì)上使其最小化,這樣可以使采樣頻率轉(zhuǎn)換不會(huì)影響信號(hào)分辨率的本底噪聲。如果輸入采樣頻率在不時(shí)變化(比如在變速搜尋或選聽中),與初始樣本有關(guān)的插入樣本的位置也將改變,這便需要對(duì)濾波器相位進(jìn)行實(shí)時(shí)計(jì)算?,F(xiàn)在許多工作站都把采樣頻率轉(zhuǎn)換作為一個(gè)標(biāo)準(zhǔn)或備選的功能。這樣,在一種采樣頻率下錄制或編輯的素材可以在另一采樣頻率下輸出(如48kHzDAT錄音,以44.1kHz被編輯或轉(zhuǎn)成CD母版;或者44.1kHz素材轉(zhuǎn)換為22kHz,以便在多媒體中使用),可保證采樣頻率轉(zhuǎn)換是高質(zhì)量的,不會(huì)影響錄音的音質(zhì)。通常,只有在非用不可的情況下,才進(jìn)行采樣頻率轉(zhuǎn)換。簡(jiǎn)陋的設(shè)備經(jīng)常忽略了使用正確的防止混疊的低通濾波器,或者只使用非?;镜臄?shù)字濾波器,這會(huì)導(dǎo)致采樣頻率轉(zhuǎn)換后音質(zhì)的劣化。當(dāng)外部設(shè)備超出了工作站所能接受的范圍時(shí),采樣頻率轉(zhuǎn)換也作為將外部數(shù)字信號(hào)源與標(biāo)準(zhǔn)采樣頻率基準(zhǔn)同步的有效方法。第2章數(shù)字聲頻記錄技術(shù)2.1數(shù)字錄音帶(DAT)數(shù)字錄音帶(DAT)是一種可以大規(guī)模生產(chǎn)的數(shù)字聲頻記錄介質(zhì)。在DAT格式中,利用螺旋掃描帶存儲(chǔ)器來(lái)記錄和重放聲頻信號(hào),其支持3種采樣頻率,即32kHz、44.1kHz和48kHz,在某些模式下,也支持96kHz的采樣頻率。因?yàn)镈AT記錄器具有數(shù)字信號(hào)輸入和輸出端口,所以可以將兩臺(tái)記錄器互連,實(shí)現(xiàn)高質(zhì)量的磁帶復(fù)制,且子碼信息也跟隨數(shù)字聲頻數(shù)據(jù)傳輸。數(shù)字聲頻磁帶易于獲得很寬的信號(hào)動(dòng)態(tài)范圍、很小的畸變和很高的信噪比,特別是數(shù)字信號(hào)具有靈活的變換與處理特性和極高的復(fù)制特性,使其明顯地優(yōu)于模擬記錄方式。2.1.1DAT盒式磁帶的構(gòu)造對(duì)于DAT記錄格式,專門設(shè)計(jì)有DAT盒式磁帶,并對(duì)其進(jìn)行了標(biāo)準(zhǔn)化。盒式磁帶的尺寸為73mm×54mm×10.5mm,如圖2-1所示,比半個(gè)模擬錄音帶稍大一點(diǎn)。磁帶寬度為3.82mm(經(jīng)常稱為4mm磁帶),與模擬磁帶中所用的1/8英寸(1英寸=2.54cm)的帶子相同;典型厚度為13μm(其中氧化層約3μm),與模擬C-90磁帶厚度相等。在一個(gè)大約60m的長(zhǎng)度上,DAT可錄制2h的聲音。通過(guò)減緩磁帶速度、降低采樣頻率、減小輪盤直徑或者使用更薄的磁帶,記錄時(shí)間可長(zhǎng)達(dá)4~6h。磁帶介質(zhì)是一種具有高矯頑力的金屬氧化物微粒。圖2-1DAT盒式磁帶的外部和內(nèi)部結(jié)構(gòu)DAT磁帶盒用以保護(hù)內(nèi)部磁帶。只有當(dāng)一盒磁帶被放入DAT錄音機(jī)后,滑板才收縮,露出磁帶的輪轂,保護(hù)罩才打開,允許對(duì)磁帶進(jìn)行操作。如圖2-2所示,磁帶導(dǎo)架牽引出磁帶,并將磁帶卷繞在旋轉(zhuǎn)磁鼓上。一個(gè)磁帶盒內(nèi)部的輪閘機(jī)構(gòu)保證磁帶的松弛度最小。另外,還提供光學(xué)檢測(cè)的措施,利用透射光或反射光來(lái)確定磁帶的末端(或始端)。前者的方法是使光折射通過(guò)磁帶盒的頂角,后者是利用放置在磁帶盒中透明窗口上的棱鏡體來(lái)實(shí)現(xiàn)。圖2-2DAT和旋轉(zhuǎn)磁頭視圖在DAT的標(biāo)準(zhǔn)位置上都有4個(gè)識(shí)別孔,用來(lái)幫助錄音機(jī)確認(rèn)磁帶類型。前面的3個(gè)孔組成一個(gè)編碼,標(biāo)志不同厚度和磁道間距的4種狀態(tài)???、2、3構(gòu)成下列編碼:000(標(biāo)準(zhǔn)磁道間距,13μm磁帶)、010(標(biāo)準(zhǔn)磁道間距,薄磁帶)、001(寬磁道間距,13μm磁帶)、011(寬磁道間距,薄磁帶)。這里0表示孔打開,1表示孔關(guān)閉。第四個(gè)孔標(biāo)識(shí)預(yù)錄帶(1)或者非預(yù)錄帶(0)。DAT盒式磁帶的一端有一個(gè)安全翼片。當(dāng)禁止錄制或者是防止誤擦除時(shí),翼片可以滑向磁帶中部,以打開磁帶下端的一個(gè)防復(fù)制孔(1)。當(dāng)要錄制時(shí),翼片必須滑出(0)到磁帶盒的邊緣。另外兩個(gè)朝向磁帶中心的基準(zhǔn)孔用于磁帶位置的校準(zhǔn)。磁帶頂部的一個(gè)槽口用來(lái)作為裝載夾使用。2.1.2DAT模式的分類與特點(diǎn)表2-1中總結(jié)了DAT的4種記錄/重放(REC/PB)模式和2種單放模式的標(biāo)準(zhǔn)。在任何DAT錄音機(jī)上均可實(shí)現(xiàn)符合標(biāo)準(zhǔn)的記錄/重放模式和2種單放模式(分別稱為寬模式和正常模式)。標(biāo)準(zhǔn)模式可提供16bit的線性數(shù)字轉(zhuǎn)換和44.1kHz或48kHz的采樣頻率。絕大多數(shù)客戶的DAT錄音機(jī)同時(shí)有模擬和數(shù)字輸入和輸出。錄音機(jī)中包含一個(gè)SCMS電路,當(dāng)任何數(shù)字源的比特流中的禁止復(fù)制標(biāo)識(shí)處于工作狀態(tài)時(shí),它可以防止復(fù)制磁帶。表2-1DAT空白磁帶和預(yù)錄制磁帶不同記錄/重放模式的技術(shù)規(guī)格其他3種記錄/重放模式使用32kHz的采樣頻率,分別稱為選項(xiàng)1、選項(xiàng)2、選項(xiàng)3。選項(xiàng)1提供16bit的線性數(shù)字轉(zhuǎn)換下的2h記錄時(shí)間;選項(xiàng)2提供12bit非線性數(shù)字轉(zhuǎn)換下的4h記錄時(shí)間,磁帶的線速度和磁鼓的轉(zhuǎn)速減半;選項(xiàng)3同樣使用12bit的非線性數(shù)字轉(zhuǎn)換,提供四通道的記錄和重放功能。某些廠商的DAT錄音機(jī)工作在96kHz的采樣頻率下,使磁帶速度加倍,記錄時(shí)間減半;另一種改進(jìn)型錄音機(jī)的采樣頻率為48kHz,可進(jìn)行24bit記錄。這兩種錄音機(jī)與傳統(tǒng)的DAT錄音機(jī)都不兼容。2.1.3DAT硬件設(shè)計(jì)的基本方案DAT技術(shù)同樣借鑒了旋轉(zhuǎn)磁頭視頻技術(shù)和CD技術(shù)。要在磁帶上記錄大量的數(shù)據(jù),必須應(yīng)用大量精密的記錄技術(shù)來(lái)提高記錄性能。另外,子碼覆蓋等用戶特性要求數(shù)據(jù)記錄具有靈活性。在任何數(shù)字聲頻系統(tǒng)中,調(diào)制碼和糾錯(cuò)在決定系統(tǒng)性能中均具有重要地位。在DAT錄音機(jī)中使用的許多硬件與CD機(jī)一樣,但增加了一些編碼電路。其主要硬件單元如圖2-3所示,包括A/D和D/A轉(zhuǎn)換器、調(diào)制解調(diào)器、糾錯(cuò)編碼器和解碼器。聲頻信號(hào)以數(shù)字形式輸入,模擬聲頻信號(hào)通過(guò)A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字形式,同時(shí)還實(shí)現(xiàn)了糾錯(cuò)編碼和交織功能。如同任何一個(gè)螺旋掃描系統(tǒng)一樣,在記錄之前,必須通過(guò)時(shí)域壓縮把輸入的聲頻信號(hào)分割成離散的段:重放時(shí),再用時(shí)域擴(kuò)展把這些離散段結(jié)合起來(lái),形成連續(xù)聲頻輸出信號(hào)。記錄用的輸出緩存時(shí)鐘頻率高于數(shù)據(jù)輸入的時(shí)鐘頻率,以滿足時(shí)域壓縮的需要。比特流中加入了子碼信息,并將數(shù)據(jù)從并行形式轉(zhuǎn)換為串行形式。數(shù)字信號(hào)經(jīng)過(guò)8-10調(diào)制編碼后,通過(guò)記錄放大器、旋轉(zhuǎn)變壓器和旋轉(zhuǎn)磁頭等記錄到磁帶上。圖2-3DAT錄音機(jī)/播放器的框圖在重放時(shí),通過(guò)磁頭和磁帶的移動(dòng),將信號(hào)導(dǎo)入磁頭,激勵(lì)出所記錄的波形。磁道尋跡信號(hào)從磁帶上被讀出,用來(lái)自動(dòng)調(diào)整磁道。8-10調(diào)制編碼將數(shù)據(jù)重新轉(zhuǎn)成并行的比特流形式。子碼數(shù)據(jù)分離出來(lái)以后,用于操作系統(tǒng)和伺服控制。寄存器允許執(zhí)行和解交織時(shí)域擴(kuò)展,并用來(lái)消除速度不均勻性。解交織在糾錯(cuò)操
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 職業(yè)培訓(xùn)師個(gè)人教學(xué)工作總結(jié)范文
- 初中語(yǔ)文教師作文指導(dǎo)培訓(xùn)心得體會(huì)
- 道法六上學(xué)習(xí)課程教案計(jì)劃
- 小學(xué)數(shù)學(xué)集體備課心得體會(huì)
- 醫(yī)院藥品安全突發(fā)事件響應(yīng)操作流程
- 人教版小學(xué)三年級(jí)語(yǔ)文下冊(cè)師資培訓(xùn)計(jì)劃
- 潛能生轉(zhuǎn)化心理輔導(dǎo)計(jì)劃
- 科學(xué)二年級(jí)上冊(cè)教學(xué)內(nèi)容計(jì)劃
- 特殊學(xué)科教師暑期研修心得體會(huì)
- 中世紀(jì)英格蘭婦女債務(wù)訴訟研究
- 小學(xué)道德與法治培訓(xùn)感悟
- 營(yíng)區(qū)物業(yè)服務(wù)營(yíng)區(qū)物業(yè)服務(wù)保密措施
- 2023年春季內(nèi)蒙古高一化學(xué)學(xué)業(yè)水平合格性考試卷真題
- 思維導(dǎo)圖在小學(xué)數(shù)學(xué)復(fù)習(xí)課中的應(yīng)用研究 論文
- 導(dǎo)管小組護(hù)理管理手冊(cè)
- 寶鋼硅鋼廠工藝流程
- 退伙協(xié)議個(gè)體工商戶
- 中草藥種植的土壤改良技術(shù)
- 尿膿毒癥護(hù)理查房
- 安全綠十字看板(A4打?。?/a>
- 家長(zhǎng)會(huì)課件:七年級(jí)暑假家長(zhǎng)會(huì)課件
評(píng)論
0/150
提交評(píng)論