




已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二章 數(shù)字聲音及MIDI,信息:數(shù)、文、形、音、圖 音頻:麥克風(fēng)、揚聲器 多媒體計算機: 聲音的輸入、存儲、處理、輸出 聲音:消息、意向、情感,2.1 聲音與聽覺,聲音:通過空氣傳播的一種連續(xù)的波,又稱聲波。 聲音的度量:頻率與幅度(聲波壓力的大?。?頻率用音高表示,幅度用聲強表示 與看得見的水波類似,波形聲音,波形聲音,實際上包含了所有的聲音形式。任何聲音信號,包括麥克風(fēng)、磁帶錄音、無線電和電視廣播、光盤等各種聲源所產(chǎn)生的聲音,都要首先對其進行模數(shù)轉(zhuǎn)換,然后再恢復(fù)出來。,語音(speech),人的聲音不僅是一種波形,而且還有內(nèi)在的語言、語音學(xué)的內(nèi)涵,可以利用特殊的方法進行抽取,通常將語音也作為一種媒體。,音樂,音樂是符號化了的聲音。這種符號就是樂曲,樂譜是轉(zhuǎn)化為符號媒體的聲音。電子樂器數(shù)字接口(musical instrument digital interface, MIDI )是十分規(guī)范的一種形式。,帶寬與聽覺 Hertz,Amplitude, Frequency infra-sound, ultrasound, hypersound,18k,感知聲音的幅度:用dyne(達因)/平方厘米表示,常轉(zhuǎn)換成0120dB(decibel),但對不同的頻率,同樣的聲強,感覺不同。 聲音信號: 有許多不同頻率的信號組成,又稱復(fù)合信號。 帶寬:組成復(fù)合信號的頻率范圍。 純音:單一頻率的聲音。,聲音是由空氣中分子的振動而產(chǎn)生的。自 然界的聲音是一個隨時間而變化的連續(xù)信號,可近似地看成是一種周期性的函數(shù)。通常用模擬的連續(xù)波形描述聲波的形狀,單一頻率的聲波可用一條正弦波表示,如下圖所示。,基線是測量模擬信號的基準點。 聲波的振幅表示聲音信號的強弱程度。 聲波的頻率反映出聲音的音調(diào),聲音細尖表示頻率高,聲音粗低表示頻率低。 振幅和頻率不變的聲音信號,稱為單音。單音一般只能由專用電子設(shè)備產(chǎn)生。 在日常生活中,我們聽到的自然界的聲音一般都屬于復(fù)音,其聲音信號由不同的振幅與頻率合成而得到。,模擬聲音信號:可分解成一系列正弦波的線性疊加。 最低頻的音波稱為基音,頻率為基頻 其余的為泛音,頻率是基頻的整數(shù)倍。,聲音三要素:音高、音色、音強 音高:由基頻決定,基頻取對數(shù)后與人的音高感覺成線性關(guān)系。 音色:有混入基音中的泛音決定。 音強:幅度,聽覺與聲音信號強度不成線性關(guān)系,因而用20log幅度(分貝)表示,(1). 采樣和量化,(c) 采樣信號的量化,(a) 模擬音頻信號,(b) 音頻信號的采樣,數(shù)字化音頻的過程如下圖所示。,2.2 聲音信號數(shù)字化,從模擬信號到數(shù)字信號 模擬信號:在時間與幅度上都連續(xù),連續(xù) 記為x(t). 離散信號:按一定的時間間隔T,得到的x(nT). T為抽樣周期,1/T抽樣頻率 量化:把抽樣序列x(nT)量化成一個有限個幅度之的集合x(nT).,對模擬音頻信號進行采樣量化編碼后,得到數(shù)字音頻。數(shù)字音頻的質(zhì)量取決于 采樣頻率 量化位數(shù) 聲道數(shù),采樣頻率,采樣頻率是指一秒鐘時間內(nèi)采樣的次數(shù)。 在計算機多媒體音頻處理中,采樣頻率通常采用三種:11.025KHz(語音效果)、22.05KHz(音樂效果)、44.1KHz(高保真效果)。常見的CD唱盤的采樣頻率即為44.1KHz。,量化位數(shù),量化位數(shù)也稱“量化精度”,是描述每個采樣點樣值的二進制位數(shù)。 例如,8位量化位數(shù)表示每個采樣值可以用28即256個不同的量化值之一來表示,而16位量化位數(shù)表示每個采樣值可以用216即65536個不同的量化值之一來表示。常用的量化位數(shù)為8位、12位、16位。,聲道數(shù),聲音通道的個數(shù)稱為聲道數(shù),是指一次采樣所記錄產(chǎn)生的聲音波形個數(shù)。 記錄聲音時,如果每次生成一個聲波數(shù)據(jù),稱為單聲道;每次生成兩個聲波數(shù)據(jù),稱為雙聲道(立體聲)。隨著聲道數(shù)的增加,所占用的存儲容量也成倍增加。,2. 聲音數(shù)字化: Sampling, Quantization, Coding 采樣頻率與量化精度 3.采樣頻率 奈奎斯特(Nyquist)定理(1928年提出原理,仙儂(Shannon)形成定理并應(yīng)用,1933年卡切尼科夫用公式表述): 采樣頻率2f 這里f為被采樣信號的最高頻率。,4. 量化精度 量化: 取樣值(-,+)有限個數(shù)(量化值近似) 若量化值有J個,若用二進制表示,需要R=log2(J) 位 量化誤差:用有限的離散值表示無限多的連續(xù)值,必然存在誤差. 該誤差又稱為量化噪聲(與一般的噪聲不同)。 采樣精度可以用信噪比表示: R為編碼位數(shù),5. 音頻數(shù)據(jù)率 未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)率(bit/s) 采樣頻率(Hz)量化位數(shù) (bit)聲道數(shù) 音頻數(shù)據(jù)存儲量(Byte) 數(shù)據(jù)率(bit/s)持續(xù)時間(s) / 8 例:采樣率11.025KHz、量化位8位,采集1分鐘, 則:音頻數(shù)據(jù)率11.025(KHz)8(bit) 88.2 (Kbit/s) 音頻數(shù)據(jù)量11.025(KHz)8(bit) 60(s)/8 0.66 (MByte),存儲量=采樣頻率量化位數(shù)/8聲道數(shù)時間,聲音的質(zhì)量與數(shù)據(jù)率,根據(jù)聲音的頻帶,把聲音的質(zhì)量分為5個等級,2.3 聲音文件的存儲格式,聲音文件的格式: PC機:.wav Apple: .aiff, .snd Unix: .au 2. 波形文件格式:1991年IBM與微軟開發(fā)(以 .wav為擴展名) Fig 2.3 3. 常見聲音文件的擴展名 表2-2,聲音文件,在多媒體技術(shù)中,存儲聲音信息的常用文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SNO文件和RMI文件等。,(1) WAV文件,WAV是Microsoft公司的音頻文件格式。利用Microsoft Sound System軟件Sound Finder可以將AIF、SND和VOD文件轉(zhuǎn)換到WAV格式。 WAV文件來源于對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一系列離散的采樣點,以不同的量化位數(shù)(8位或16位)把這些采樣點的值轉(zhuǎn)換成二進制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。WAV文件是由采樣數(shù)據(jù)組成的,所以它需要的存儲容量很大。,(2) VOC文件,VOC文件是Creative公司波形音頻文件格式,也是聲卡使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。文件頭包含一個標(biāo)識、版本號和一個指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊,如聲音數(shù)據(jù)、靜音、標(biāo)記、ASCII碼文件、重復(fù)的結(jié)束,以及終止標(biāo)記、擴展塊等。,(3) MIDI文件,MIDI(musical instrument digital interface)是一種技術(shù)規(guī)范,從它的英文全名可以看出,它用于音樂。,其他音頻文件,最重要的是PCM格式,它是模擬的音頻信號經(jīng)數(shù)模轉(zhuǎn)換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。在聲卡提供的軟件中,可以利用VOCHDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具也可以將PCM音頻文件轉(zhuǎn)換成Microsoft的WAV格式。 AIF是Apple計算機的音頻文件格式。WindowsConvert工具可以把AIF格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。,2.4 聲音工具,聲音工具:錄、放、存儲、編輯 Windows自帶:sound recorder 播放和錄音設(shè)備:SoundMAX Digital Audio 聲卡:附帶wave studio 網(wǎng)上:cool edit, goldwave Windows Media Player 播放和組織計算機和 Internet 上的數(shù)字媒體文件。這就好象把收音機、視頻播放機、CD 播放機和信息數(shù)據(jù)庫等都裝入了一個應(yīng)用程序中 Windows Media Player 播放器支持的文件類型.doc,2.5 聲音質(zhì)量的度量,1.聲音信號的帶寬 2.客觀質(zhì)量度量 signal-to-noise ratio,SNR 3.主觀質(zhì)量度量:人的感覺 MOS:mean opinion score,聲音質(zhì)量 MOS標(biāo)準,2.5 聲音質(zhì)量的度量,作業(yè) 使用“錄音機”軟件把10秒鐘的CD音樂錄制成CD音質(zhì)(44.1kz、16位、雙聲道、PCM)的.wav文件)。 把錄制的文件分別轉(zhuǎn)換為“22.05kz、16位、單聲道、PCM”, “11.025kz、8位、單聲道、PCM”以及“44.1kz、4位、單聲道、ADPCM” 比較以上四種格式的聲音文件的數(shù)據(jù)量和聲音音質(zhì),2.6 電子樂器數(shù)字接口MIDI,MIDI(Musical Instruments Digital Interface) Musical synthesizers、musical instruments、計算機之間交換音樂信息的一種標(biāo)準協(xié)議。 MIDI是一套指令,指示MIDI設(shè)備做什么,如何做。 MIDI不是聲音信號,而是發(fā)送給Midi 設(shè)備的,產(chǎn)生聲音或執(zhí)行動作的指令。 MIDI樂音的產(chǎn)生方法 頻率調(diào)制合成, FM 波形表合成 wave table synthesis,3.頻率調(diào)制FM合成(frequency modulation): 把幾種樂音的波形用數(shù)字表達,存于計算機中并通過數(shù)模轉(zhuǎn)換器來生成樂音。專利售給Yamaha公司。樂音由一組參數(shù)控制。 4.波形表合成 把樂器的真實聲音記錄下來,生成各種音符 在樂器上演奏音符,采樣 存于ROM中 合成。圖2-9,5.MIDI系統(tǒng): MPC:MIDI 接口與聲音模塊組合在卡上。SoundMAX Wavetable synthesizer(MIDI音樂播放器) Windows Media Player 播放 MIDI音樂 制作軟件Midisoft Studio 6,MIDI文件,記錄MIDI信息的標(biāo)準格式文件稱MIDI文件,其中包含音符、定時和多達16個通道的樂器定義以及鍵號、通道號、持續(xù)時間、音量和擊鍵力度等各個音符的有關(guān)信息。定義和產(chǎn)生樂曲的MIDI信息和數(shù)據(jù)組存放于MIDI文件中,每個MIDI文件最多可存放16個音樂通道的信息。 音序器是一種為MIDI作曲而設(shè)計的軟件或設(shè)備,可用來記錄、播放及編輯MIDI事件,大多數(shù)音序器可輸入輸出MIDI文件。當(dāng)演奏MIDI文件時,音序器將MIDI信息從文件中取出并送至合成器中。,MIDI作品,MIDI作者可以購買現(xiàn)成的產(chǎn)品,也可以自己制作。當(dāng)然,開發(fā)自己的MIDI作品,除了必須擁有計算機方面的知識與設(shè)備之外,還需要具備專業(yè)音樂知識和專用工具。,數(shù)字化聲音和MIDI的比較,與MIDI數(shù)據(jù)相比,數(shù)字化的聲音是聲音的實際表示。它代表了聲音的瞬時幅度。因為它與設(shè)備無關(guān),每次播放時它都發(fā)出相同的聲音。從這一點看,它的一致性好,但代價較高,因其數(shù)據(jù)文件要求較大的存儲空間。 MIDI數(shù)據(jù)是與設(shè)備有關(guān)的,即MIDI音樂文件所產(chǎn)生的聲音與用來播放的特定的MIDI設(shè)備有關(guān)。,(3) 在不需要改變音調(diào)或降低音質(zhì)的情況下,可以通過改變其速度來改變MIDI文件的長度。MIDI數(shù)據(jù)是完全可編輯的,我們可以用多種方法來處理它的每一個細節(jié),而在處理數(shù)字化聲音時,這些方法卻完全用不上。 (4) 為了創(chuàng)建數(shù)字化聲音所要求的準備與編程工作,不需要掌握許多音樂理論知識,MIDI則要求比較多。 (5) 在應(yīng)用軟件和系統(tǒng)支持方面數(shù)字化聲音都有更多的選擇,不管對Macintosh還是Windows平臺均如此。,MIDI數(shù)據(jù)優(yōu)點,(1) 文件緊湊,所占空間小,MIDI文件的大小與回放質(zhì)量完全無關(guān)。通常,MIDI文件比CD質(zhì)量的數(shù)字化聲音文件小200到1000倍,它不占用較多的內(nèi)存、外存空間和CPU資源。 (2) 在某些情況下,如果所
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年煙氣脫硫設(shè)備項目規(guī)劃申請報告
- 農(nóng)業(yè)資源開發(fā)使用權(quán)利授權(quán)協(xié)議
- 2025年單證員職業(yè)資格考試試卷:單證員職業(yè)資格考試備考指導(dǎo)
- 2025年保健按摩師(初級)理論知識試卷難點解析與備考指南
- 2025年氣霧劑機械項目立項申請報告
- 2025年美容師(中級)職業(yè)技能鑒定實操試卷-美容師實操技能考核創(chuàng)新與突破篇
- 2025年麥片項目規(guī)劃申請報告
- 2025年勞動保障協(xié)理員(中級)考試試卷:勞動保障政策執(zhí)行與社會保障改革路徑創(chuàng)新
- 個人收入及財務(wù)狀況年度證明(6篇)
- 2025年專升本藝術(shù)概論考試模擬試卷:藝術(shù)創(chuàng)作分析在當(dāng)代藝術(shù)研究中的應(yīng)用
- 房屋拆除施工合同
- 國家開放大學(xué)《知識產(chǎn)權(quán)法》考試復(fù)習(xí)題庫(含答案)
- 國開農(nóng)業(yè)產(chǎn)業(yè)發(fā)展規(guī)劃形考1-4試題及答案
- 2022年臨商銀行股份有限公司招聘考試真題及答案
- Cpk 計算標(biāo)準模板
- 化工原理課程設(shè)計-用水冷卻煤油產(chǎn)品的列管式換熱器的工藝設(shè)計
- MES系統(tǒng)技術(shù)方案
- 主檔資料培訓(xùn)課件
- MT-146.1-2011-樹脂錨桿-第一部分:錨固劑
- 小學(xué)生綜合素質(zhì)發(fā)展評價手冊
- 軟件工程復(fù)習(xí)英文
評論
0/150
提交評論