03多媒體技術(shù)簡(jiǎn)介_(kāi)第1頁(yè)
03多媒體技術(shù)簡(jiǎn)介_(kāi)第2頁(yè)
03多媒體技術(shù)簡(jiǎn)介_(kāi)第3頁(yè)
03多媒體技術(shù)簡(jiǎn)介_(kāi)第4頁(yè)
03多媒體技術(shù)簡(jiǎn)介_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1多媒體技術(shù)簡(jiǎn)介多媒體技術(shù)簡(jiǎn)介第三、四講2主要內(nèi)容主要內(nèi)容多媒體數(shù)據(jù)的獲取技術(shù)數(shù)字化技術(shù)編碼技術(shù)壓縮技術(shù)多媒體技術(shù)標(biāo)準(zhǔn)存儲(chǔ)格式。31 多媒體數(shù)據(jù)的獲取技術(shù)多媒體數(shù)據(jù)的獲取技術(shù)l計(jì)算機(jī)本身可以創(chuàng)建的媒體:文本、圖形、動(dòng)畫和MIDI音樂(lè)l從外部輸入到計(jì)算機(jī)內(nèi)的媒體:圖像、音頻和視頻l圖像、音頻和視頻這三種媒體需要數(shù)字化,才能讓計(jì)算機(jī)處理。42 數(shù)字化技術(shù)數(shù)字化技術(shù)l數(shù)字化:將模擬信號(hào)變成數(shù)字信號(hào)的過(guò)程l采樣:把連續(xù)時(shí)間或者連續(xù)空間分布轉(zhuǎn)化為離散值的過(guò)程,必須遵循奈奎斯特定理l量化:把連續(xù)的采樣值轉(zhuǎn)化為離散值的過(guò)程,分為線性量化和非線性量化l編碼:把量化值表示成數(shù)字形式的過(guò)程l音頻數(shù)字化、圖像數(shù)字化

2、、視頻數(shù)字化。53 編碼技術(shù)編碼技術(shù)l編碼模型l壓縮編碼分類l統(tǒng)計(jì)編碼:哈夫曼(哈夫曼(HuffmanHuffman)編碼、香農(nóng))編碼、香農(nóng)- -費(fèi)諾編碼、費(fèi)諾編碼、算術(shù)編碼、游程編碼(算術(shù)編碼、游程編碼(RLCRLC)和)和LZWLZW編碼編碼( (第二類編碼第二類編碼) )l預(yù)測(cè)編碼l變換編碼l分形編碼l矢量化編碼l子帶編碼。64 壓縮技術(shù)壓縮技術(shù)l編碼壓縮的必要性與可能性編碼壓縮的必要性與可能性l多媒體數(shù)據(jù)存在著大量的冗余多媒體數(shù)據(jù)存在著大量的冗余:空間冗余、時(shí)空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺(jué)冗余、圖間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺(jué)冗余、圖像區(qū)域的相同性冗余和紋理的統(tǒng)計(jì)冗余像

3、區(qū)域的相同性冗余和紋理的統(tǒng)計(jì)冗余l(xiāng)文本壓縮技術(shù)文本壓縮技術(shù)l圖像壓縮技術(shù)圖像壓縮技術(shù)l音頻壓縮技術(shù)音頻壓縮技術(shù)l視頻壓縮技術(shù)。視頻壓縮技術(shù)。75 多媒體技術(shù)標(biāo)準(zhǔn)多媒體技術(shù)標(biāo)準(zhǔn)l多媒體壓縮標(biāo)準(zhǔn)l音頻壓縮標(biāo)準(zhǔn)l圖像壓縮標(biāo)準(zhǔn)l視頻壓縮標(biāo)準(zhǔn)l多媒體表示標(biāo)準(zhǔn)l同步多媒體集成語(yǔ)言lMHEG標(biāo)準(zhǔn)l多媒體元數(shù)據(jù)標(biāo)準(zhǔn)。86 存儲(chǔ)格式存儲(chǔ)格式l文本存儲(chǔ)格式:.doc、.rtf、.pdfl圖像存儲(chǔ)格式l音頻存儲(chǔ)格式: .WAVWAV、.MP3.MP3、.MID.MID、其它格式其它格式l視頻存儲(chǔ)格式。9音頻音頻幅幅值值t一個(gè)周期一個(gè)周期+空氣壓強(qiáng)空氣壓強(qiáng)0聲音包含三個(gè)要素:音調(diào)、音強(qiáng)和音色。聲音包含三個(gè)要素:音調(diào)、

4、音強(qiáng)和音色?;l與音調(diào):一個(gè)聲源每秒鐘可產(chǎn)生成百上千個(gè)波,通常把每秒鐘波峰所產(chǎn)基頻與音調(diào):一個(gè)聲源每秒鐘可產(chǎn)生成百上千個(gè)波,通常把每秒鐘波峰所產(chǎn)生的數(shù)目稱之為信號(hào)的頻率,單位用赫茲生的數(shù)目稱之為信號(hào)的頻率,單位用赫茲(Hz)或千赫茲或千赫茲(kHz)表示表示諧波與音色:諧波與音色:no稱為基波稱為基波o的的n次諧波分量次諧波分量(n就是高次諧波的方次,就是高次諧波的方次,no就是基波就是基波o的的n次諧波次諧波),也稱為泛音。音色是由混入基音的泛音所決,也稱為泛音。音色是由混入基音的泛音所決定的定的幅度與音強(qiáng):信號(hào)的幅度是從信號(hào)的基線到當(dāng)前波峰的距離。幅度決定了信幅度與音強(qiáng):信號(hào)的幅度是從信號(hào)

5、的基線到當(dāng)前波峰的距離。幅度決定了信號(hào)音量的強(qiáng)弱程度。幅度越大,聲音越強(qiáng)。號(hào)音量的強(qiáng)弱程度。幅度越大,聲音越強(qiáng)。10音頻數(shù)字化音頻數(shù)字化l連續(xù)的音頻波形可通過(guò)麥克風(fēng)等輸入設(shè)備轉(zhuǎn)化為連續(xù)的電信號(hào),要使計(jì)算機(jī)能夠處理和傳輸音頻信號(hào),必須經(jīng)過(guò)模/數(shù)轉(zhuǎn)換過(guò)程l采樣。對(duì)聲音波形的采樣就是按采樣的頻率間隔、不斷地獲取幅度的量值,使連續(xù)的聲音波形轉(zhuǎn)變?yōu)殡x散的數(shù)字量l量化。將信號(hào)范圍分割成固定數(shù)量。11圖像數(shù)字化圖像數(shù)字化l采樣(Sampling)是對(duì)圖像空間坐標(biāo)的離散化,它決定了圖像的空間分辨率,就是用一個(gè)網(wǎng)格(如右圖所示)把待處理的圖像覆蓋 ,把每一小格上模擬圖像的各個(gè)亮度取平均值,作為該小方格中點(diǎn)的值

6、l把采樣后所得的各像素灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。12編碼壓縮的必要性與可能性編碼壓縮的必要性與可能性l眾所周知,多媒體量化所需數(shù)據(jù)量大。音頻、眾所周知,多媒體量化所需數(shù)據(jù)量大。音頻、圖像和視頻的龐大數(shù)據(jù)對(duì)計(jì)算機(jī)的處理速度、圖像和視頻的龐大數(shù)據(jù)對(duì)計(jì)算機(jī)的處理速度、存儲(chǔ)容量都提出過(guò)高的要求。因此必須進(jìn)行數(shù)存儲(chǔ)容量都提出過(guò)高的要求。因此必須進(jìn)行數(shù)據(jù)量壓縮據(jù)量壓縮l從傳送的角度來(lái)看,在信道帶寬、通信鏈路容從傳送的角度來(lái)看,在信道帶寬、通信鏈路容量一定的前提下,采用編碼壓縮技術(shù),減少傳量一定的前提下,采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。因此,輸數(shù)據(jù)量,是提高

7、通信速度的重要手段。因此,更要求數(shù)據(jù)量壓縮。更要求數(shù)據(jù)量壓縮。13多媒體數(shù)據(jù)存在著大量的冗余多媒體數(shù)據(jù)存在著大量的冗余l(xiāng)眾所周知,視頻由一幀一幀的圖像組成,眾所周知,視頻由一幀一幀的圖像組成,而圖像的各像素之間,無(wú)論是在行方向而圖像的各像素之間,無(wú)論是在行方向還是在列方向,都存在著一定的相關(guān)性,還是在列方向,都存在著一定的相關(guān)性,即冗余度。應(yīng)用某種編碼方法提取或減即冗余度。應(yīng)用某種編碼方法提取或減少這些冗余度,便可以達(dá)到壓縮數(shù)據(jù)的少這些冗余度,便可以達(dá)到壓縮數(shù)據(jù)的目的。目的。14圖形圖形l圖形不直接描述數(shù)據(jù)的每一點(diǎn),而是描述產(chǎn)生這些點(diǎn)的過(guò)程與方法,在計(jì)算機(jī)圖形學(xué)和數(shù)字圖像處理中,圖像是位圖的概

8、念,基本元素是像素;圖形則是向量圖的概念,基本元素是圖元,即圖形指令。15圖像圖像16編碼模型編碼模型(圖像圖像)一個(gè)壓縮系統(tǒng)包括兩個(gè)不同的結(jié)構(gòu)塊:一個(gè)編碼器和一個(gè)解碼器一個(gè)壓縮系統(tǒng)包括兩個(gè)不同的結(jié)構(gòu)塊:一個(gè)編碼器和一個(gè)解碼器從原理來(lái)看主要分為三個(gè)階段,第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入從原理來(lái)看主要分為三個(gè)階段,第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設(shè)法去除原圖象信號(hào)的相關(guān)性,圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設(shè)法去除原圖象信號(hào)的相關(guān)性,例如對(duì)電視信號(hào)就可以去掉幀內(nèi)各種相關(guān),還可以去除幀間相關(guān)。這樣有例如對(duì)電視信號(hào)就可以去掉幀內(nèi)各種相關(guān),還可以去除幀

9、間相關(guān)。這樣有利于編碼壓縮。第三階段就是找一種更近于熵,又利于計(jì)算機(jī)處理的編碼利于編碼壓縮。第三階段就是找一種更近于熵,又利于計(jì)算機(jī)處理的編碼方式。方式。17壓縮編碼分類壓縮編碼分類18統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼l統(tǒng)計(jì)編碼屬無(wú)損編碼,它是根據(jù)消息出現(xiàn)概率統(tǒng)計(jì)編碼屬無(wú)損編碼,它是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼。統(tǒng)計(jì)編碼又可的分布特性而進(jìn)行的壓縮編碼。統(tǒng)計(jì)編碼又可分為定長(zhǎng)碼和變長(zhǎng)碼,常分為如下幾類:分為定長(zhǎng)碼和變長(zhǎng)碼,常分為如下幾類:l哈夫曼(哈夫曼(HuffmanHuffman)編碼)編碼l香農(nóng)香農(nóng)- -費(fèi)諾編碼費(fèi)諾編碼l算術(shù)編碼算術(shù)編碼l游程編碼(游程編碼(RLCRLC)lLZWLZW編碼。

10、編碼。19預(yù)測(cè)編碼預(yù)測(cè)編碼l預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在著一定的相關(guān)性,預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在著一定的相關(guān)性,利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一信號(hào)進(jìn)行預(yù)測(cè),然利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差后對(duì)實(shí)際值和預(yù)測(cè)值的差( (預(yù)測(cè)誤差預(yù)測(cè)誤差) )進(jìn)行編碼進(jìn)行編碼l預(yù)測(cè)編碼中典型的壓縮方法有脈沖編碼調(diào)制預(yù)測(cè)編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM, (PCM, Pulse Code Modulation)Pulse Code Modulation)、差分脈沖編碼調(diào)制、差分脈沖編碼調(diào)制(DPCM(DPCM,Differential Pulse Code Mo

11、dulation)Differential Pulse Code Modulation)、自適應(yīng)差、自適應(yīng)差分脈沖編碼調(diào)制分脈沖編碼調(diào)制(ADPCM(ADPCM,Adaptive Differential Adaptive Differential Pulse Code Modulation)Pulse Code Modulation)等等l預(yù)測(cè)編碼可分為無(wú)損預(yù)測(cè)編碼和有損預(yù)測(cè)編碼。預(yù)測(cè)編碼可分為無(wú)損預(yù)測(cè)編碼和有損預(yù)測(cè)編碼。20變換編碼變換編碼l變換編碼的原理如右圖所示。從圖中看出,變換編碼的原理如右圖所示。從圖中看出,存儲(chǔ)或傳輸都是在變換域中進(jìn)行的,即傳存儲(chǔ)或傳輸都是在變換域中進(jìn)行的,即傳輸

12、或存儲(chǔ)都不是空域圖像而是變換域系數(shù),輸或存儲(chǔ)都不是空域圖像而是變換域系數(shù),分一般正交變換和小波變換。分一般正交變換和小波變換。21分形編碼分形編碼l分形編碼與分形幾何相關(guān)。所謂分形幾何就是研究無(wú)限復(fù)雜分形編碼與分形幾何相關(guān)。所謂分形幾何就是研究無(wú)限復(fù)雜但具有一定意義下的自相似圖形和結(jié)構(gòu)的幾何學(xué)。分形編碼但具有一定意義下的自相似圖形和結(jié)構(gòu)的幾何學(xué)。分形編碼正是利用分形幾何中自相似的原理來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮的。首先正是利用分形幾何中自相似的原理來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮的。首先對(duì)圖像進(jìn)行分塊,然后再去尋找各塊之間的相似性,這里相對(duì)圖像進(jìn)行分塊,然后再去尋找各塊之間的相似性,這里相似性的描述主要是依靠仿射變換來(lái)確定的

13、,一旦找到了每塊似性的描述主要是依靠仿射變換來(lái)確定的,一旦找到了每塊的仿射變換,就保存下這個(gè)仿射變換的系數(shù),由于每塊的數(shù)的仿射變換,就保存下這個(gè)仿射變換的系數(shù),由于每塊的數(shù)據(jù)量遠(yuǎn)大于仿射變換的系數(shù),因而圖像得以大幅度地壓縮據(jù)量遠(yuǎn)大于仿射變換的系數(shù),因而圖像得以大幅度地壓縮 l分形圖像編碼和解碼不夠成熟,產(chǎn)生的壓縮比不夠高。壓縮分形圖像編碼和解碼不夠成熟,產(chǎn)生的壓縮比不夠高。壓縮效果還不十分理想,在當(dāng)前圖像壓縮編碼中還不能占據(jù)主導(dǎo)效果還不十分理想,在當(dāng)前圖像壓縮編碼中還不能占據(jù)主導(dǎo)地位。地位。22子帶編碼子帶編碼l由于人眼對(duì)不同頻域段的敏感程度不同,圖像由于人眼對(duì)不同頻域段的敏感程度不同,圖像信

14、號(hào)可以劃分為不同的頻域段。子帶編碼的基信號(hào)可以劃分為不同的頻域段。子帶編碼的基本思想是利用一濾波器組,將采樣將輸入信號(hào)本思想是利用一濾波器組,將采樣將輸入信號(hào)分解為高頻分量和低頻分量,然后分別對(duì)高頻分解為高頻分量和低頻分量,然后分別對(duì)高頻和低頻分量進(jìn)行量化和編碼。解碼時(shí),高頻分和低頻分量進(jìn)行量化和編碼。解碼時(shí),高頻分量和低頻分量經(jīng)過(guò)插值和共軛濾波器而合成原量和低頻分量經(jīng)過(guò)插值和共軛濾波器而合成原信號(hào)。信號(hào)。23矢量化編碼矢量化編碼l矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)性,將輸入圖像數(shù)據(jù)序列分組,每一組由性,將輸入圖像數(shù)據(jù)序列分組,每一組由m m個(gè)個(gè)數(shù)

15、據(jù)構(gòu)成一個(gè)數(shù)據(jù)構(gòu)成一個(gè)M M維矢量,一起進(jìn)行編碼,即一維矢量,一起進(jìn)行編碼,即一次量化多個(gè)點(diǎn)。根據(jù)香農(nóng)失真率理論,對(duì)于無(wú)次量化多個(gè)點(diǎn)。根據(jù)香農(nóng)失真率理論,對(duì)于無(wú)記憶信源,矢量量化編碼總是優(yōu)于標(biāo)量量化編記憶信源,矢量量化編碼總是優(yōu)于標(biāo)量量化編碼,矢量量化編碼是有損編碼。碼,矢量量化編碼是有損編碼。24文本壓縮技術(shù)文本壓縮技術(shù)l文本壓縮必須是無(wú)損壓縮l哈夫曼(哈夫曼(HuffmanHuffman)編碼)編碼l詞典編碼詞典編碼lLZ77LZ77lLZWLZW。25圖像壓縮技術(shù)圖像壓縮技術(shù)l典型的圖像壓縮系統(tǒng)主要由三部分組成:變換部分、量化部分和編碼部分26音頻壓縮技術(shù)音頻壓縮技術(shù)l音頻信息編碼技術(shù)主

16、要可分為三類音頻信息編碼技術(shù)主要可分為三類波形編碼:這種方法主要基于語(yǔ)音波形預(yù)測(cè),它力圖使重建的語(yǔ)音波波形編碼:這種方法主要基于語(yǔ)音波形預(yù)測(cè),它力圖使重建的語(yǔ)音波形保持原有的波形狀態(tài)。常用的波形編碼技術(shù)有增量調(diào)制形保持原有的波形狀態(tài)。常用的波形編碼技術(shù)有增量調(diào)制(DM)(DM)、自適、自適應(yīng)差分脈沖編碼調(diào)制應(yīng)差分脈沖編碼調(diào)制(ADPCM)(ADPCM)、子帶編碼、子帶編碼(SBC)(SBC)和矢量量化編碼和矢量量化編碼(VQ)(VQ)等等等等參數(shù)編碼:參數(shù)編碼的方法是將音頻信號(hào)以某種模型表示,再抽出合參數(shù)編碼:參數(shù)編碼的方法是將音頻信號(hào)以某種模型表示,再抽出合適的模型參數(shù)和參考激勵(lì)信號(hào)進(jìn)行編碼

17、;聲音重放時(shí),再根據(jù)這些參適的模型參數(shù)和參考激勵(lì)信號(hào)進(jìn)行編碼;聲音重放時(shí),再根據(jù)這些參數(shù)重建即可。顯然參數(shù)編碼壓縮比很高,但計(jì)算量大。它主要用于在數(shù)重建即可。顯然參數(shù)編碼壓縮比很高,但計(jì)算量大。它主要用于在窄帶信道上提供窄帶信道上提供4.8kb/s4.8kb/s以下的低速語(yǔ)音通信和一些對(duì)延時(shí)要求較寬以下的低速語(yǔ)音通信和一些對(duì)延時(shí)要求較寬的應(yīng)用場(chǎng)合(如衛(wèi)星通信等)。最常用的參數(shù)編碼法為線性預(yù)測(cè)的應(yīng)用場(chǎng)合(如衛(wèi)星通信等)。最常用的參數(shù)編碼法為線性預(yù)測(cè)(LPCLPC)編碼)編碼混合編碼:是指同時(shí)使用兩種或兩種以上的編碼方法進(jìn)行編碼的過(guò)程?;旌暇幋a:是指同時(shí)使用兩種或兩種以上的編碼方法進(jìn)行編碼的過(guò)程。

18、由于每種編碼方法都有自己的優(yōu)勢(shì)和不足,若是用兩種或兩種以上的由于每種編碼方法都有自己的優(yōu)勢(shì)和不足,若是用兩種或兩種以上的編碼方法進(jìn)行編碼,可以優(yōu)勢(shì)互補(bǔ),克服各自的不足,從而達(dá)到高效編碼方法進(jìn)行編碼,可以優(yōu)勢(shì)互補(bǔ),克服各自的不足,從而達(dá)到高效數(shù)據(jù)壓縮的目的。數(shù)據(jù)壓縮的目的。27視頻壓縮技術(shù)視頻壓縮技術(shù)l視頻壓縮技術(shù)兩個(gè)要點(diǎn):l在空間上,圖像數(shù)據(jù)采用JPEG壓縮算法l在時(shí)間上,圖像數(shù)據(jù)采用移動(dòng)補(bǔ)償算法l三種圖像lI圖像 利用圖像自身的相關(guān)性壓縮, 提供壓縮數(shù)據(jù)流中的隨機(jī)存取的點(diǎn),采用基于ADCT的編碼技術(shù),壓縮后,每個(gè)像素為1b-2blP圖像 用最近的前一個(gè)I圖像(或P圖像)預(yù)測(cè)編碼得到(前向預(yù)測(cè)

19、)lB圖像 B圖像在預(yù)測(cè)時(shí), 既可使用了前一個(gè)圖像作參照, 也可使用下一個(gè)圖像做參照或同時(shí)使用前后兩個(gè)圖像作為參照?qǐng)D像(雙向預(yù)測(cè))。28空間冗余l(xiāng)這是靜態(tài)圖像存在的最主要的一種這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄了畫面上數(shù)據(jù)冗余。一幅圖像記錄了畫面上可見(jiàn)景物的顏色。同一景物表面上可見(jiàn)景物的顏色。同一景物表面上各采樣點(diǎn)的顏色之間往往存在著空各采樣點(diǎn)的顏色之間往往存在著空間連貫性,從而產(chǎn)生了空間冗余。間連貫性,從而產(chǎn)生了空間冗余。29時(shí)間冗余l(xiāng)在視頻的相鄰幀間,往往包含相同的背景和移在視頻的相鄰幀間,往往包含相同的背景和移動(dòng)物體,因此,后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有許動(dòng)物體,因此,后一幀

20、數(shù)據(jù)與前一幀數(shù)據(jù)有許多共同的地方,即在時(shí)間上存在大量的冗余。多共同的地方,即在時(shí)間上存在大量的冗余。30結(jié)構(gòu)冗余l(xiāng)在有些圖像的紋理區(qū),圖像的像素值存在著明在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。例如,方格狀的地板圖案等。顯的分布模式。例如,方格狀的地板圖案等。我們稱這種冗余為結(jié)構(gòu)冗余。我們稱這種冗余為結(jié)構(gòu)冗余。31知識(shí)冗余l(xiāng)有些圖像的理解與某些知識(shí)有相當(dāng)大的相關(guān)性。有些圖像的理解與某些知識(shí)有相當(dāng)大的相關(guān)性。例如,人臉的圖像有固定的結(jié)構(gòu)。這類規(guī)律性例如,人臉的圖像有固定的結(jié)構(gòu)。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗

21、余。此類冗余為知識(shí)冗余。32視覺(jué)冗余l(xiāng)事實(shí)表明,人類的視覺(jué)系統(tǒng)對(duì)圖像場(chǎng)的敏感性事實(shí)表明,人類的視覺(jué)系統(tǒng)對(duì)圖像場(chǎng)的敏感性是非均勻的和非線性的。然而,在記錄原始圖是非均勻的和非線性的。然而,在記錄原始圖像數(shù)據(jù)時(shí),通常假定視覺(jué)系統(tǒng)是線性的和均勻像數(shù)據(jù)時(shí),通常假定視覺(jué)系統(tǒng)是線性的和均勻的,對(duì)視覺(jué)敏感和不敏感的部分同等對(duì)待,從的,對(duì)視覺(jué)敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生了比理想編碼更多的數(shù)據(jù),這就是視覺(jué)而產(chǎn)生了比理想編碼更多的數(shù)據(jù),這就是視覺(jué)冗余。冗余。33圖像區(qū)域的相同性冗余l(xiāng)是指在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有是指在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復(fù)性存像素

22、值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲(chǔ),這就是圖像區(qū)域的相似性冗余。儲(chǔ),這就是圖像區(qū)域的相似性冗余。34紋理的統(tǒng)計(jì)冗余l(xiāng)有些圖像紋理盡管不嚴(yán)格服從某有些圖像紋理盡管不嚴(yán)格服從某分布規(guī)律,分布規(guī)律,但是它在統(tǒng)計(jì)的意義上服從該規(guī)律。利用這種但是它在統(tǒng)計(jì)的意義上服從該規(guī)律。利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,所以我們性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,所以我們稱之為紋理的統(tǒng)計(jì)冗余。稱之為紋理的統(tǒng)計(jì)冗余。35哈夫曼(Huffman)編碼l其編碼思想與其編碼思想與Shannon-Fano編碼方法基本一致,編碼方法基本一致,但構(gòu)造二叉樹(shù)的方法則相反,不是自上而下,而是但構(gòu)造二叉樹(shù)的方法則相反,不是自上而下

23、,而是自下而上、從樹(shù)葉到樹(shù)根生成二叉樹(shù)。具體編碼過(guò)自下而上、從樹(shù)葉到樹(shù)根生成二叉樹(shù)。具體編碼過(guò)程如下:程如下:l將信源符號(hào)按概率遞減順序排列;將信源符號(hào)按概率遞減順序排列;l把兩個(gè)最小的概率加起來(lái),作為新符號(hào)的概率;把兩個(gè)最小的概率加起來(lái),作為新符號(hào)的概率;l重復(fù)步驟(重復(fù)步驟(1)和()和(2),直到概率達(dá)到),直到概率達(dá)到“1”為止;為止;l在每次合并消息時(shí),將被合并的消息賦于在每次合并消息時(shí),將被合并的消息賦于“1”和和“0”或或“0”和和“l(fā)”;l尋找從每一信源符號(hào)到概率為尋找從每一信源符號(hào)到概率為“1”處的路徑,記錄下路徑處的路徑,記錄下路徑上的上的“l(fā)”和和“0”;1.對(duì)每一符號(hào)寫

24、出從碼樹(shù)的根到終結(jié)點(diǎn)的對(duì)每一符號(hào)寫出從碼樹(shù)的根到終結(jié)點(diǎn)的“l(fā)”、“0”序列。序列。36香農(nóng)-費(fèi)諾編碼簡(jiǎn)稱為簡(jiǎn)稱為S-F編碼,是一種變長(zhǎng)編碼,其基本思想編碼,是一種變長(zhǎng)編碼,其基本思想是按信源符號(hào)出現(xiàn)的概率大小進(jìn)行排序,出現(xiàn)概是按信源符號(hào)出現(xiàn)的概率大小進(jìn)行排序,出現(xiàn)概率大的分配短碼,反之則分配長(zhǎng)碼。具體編碼過(guò)率大的分配短碼,反之則分配長(zhǎng)碼。具體編碼過(guò)程如下:程如下: l信源符號(hào)按概率遞減順序排列。信源符號(hào)按概率遞減順序排列。l把符號(hào)序列分成上下兩部分,使上下兩部分的概率和相把符號(hào)序列分成上下兩部分,使上下兩部分的概率和相等或接近相等。等或接近相等。l對(duì)上部分子序列編碼為對(duì)上部分子序列編碼為“0”

25、,相當(dāng)于左子樹(shù),對(duì)下部分,相當(dāng)于左子樹(shù),對(duì)下部分子序列編碼為子序列編碼為“1”,相當(dāng)于右子樹(shù),相當(dāng)于右子樹(shù)l重復(fù)上述步驟,直到每個(gè)子序列只包含一個(gè)符號(hào)為止。重復(fù)上述步驟,直到每個(gè)子序列只包含一個(gè)符號(hào)為止。 37算術(shù)編碼 算術(shù)編碼也是一種信息熵編碼方法,它用算術(shù)編碼也是一種信息熵編碼方法,它用0到到1之間的一個(gè)實(shí)數(shù)對(duì)輸入的信息進(jìn)行編碼。用到之間的一個(gè)實(shí)數(shù)對(duì)輸入的信息進(jìn)行編碼。用到兩個(gè)基本的參數(shù),一是信源符號(hào)的概率,二是兩個(gè)基本的參數(shù),一是信源符號(hào)的概率,二是信源符號(hào)對(duì)應(yīng)和編碼區(qū)間。一般的信源符號(hào)集信源符號(hào)對(duì)應(yīng)和編碼區(qū)間。一般的信源符號(hào)集x可表示為:可表示為:38游程編碼(RLC)l行程編碼(行程

26、編碼(RLE)通過(guò)統(tǒng)計(jì)信源符號(hào)中的重復(fù)個(gè)數(shù),)通過(guò)統(tǒng)計(jì)信源符號(hào)中的重復(fù)個(gè)數(shù),并以并以格式來(lái)編碼。適用于壓格式來(lái)編碼。適用于壓縮包含大量重復(fù)信息的信源。其基本思想是:按行存縮包含大量重復(fù)信息的信源。其基本思想是:按行存儲(chǔ)一個(gè)顏色值和相同色值的像素個(gè)數(shù),如下圖。儲(chǔ)一個(gè)顏色值和相同色值的像素個(gè)數(shù),如下圖。(a) 圖像示例(168像素)0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0

27、 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0(b) 示例圖像的像素值(168像素) 16 0 02 0 11 01 03 0 02 0 01 01 13 0 02 0 01 01 13 0 02 0 01 01 13 0 02 0 11 01 03 0 16 0 16 0(c) RLE編碼39LZW編碼l詞典編碼主要是利用編碼數(shù)據(jù)本身存在字符串重復(fù)特性來(lái)實(shí)詞典編碼主要是利用編碼數(shù)據(jù)本身存在字符串重復(fù)特性來(lái)實(shí)現(xiàn)數(shù)據(jù)壓

28、縮的。算法的核心就是如何動(dòng)態(tài)地形成詞典,以及現(xiàn)數(shù)據(jù)壓縮的。算法的核心就是如何動(dòng)態(tài)地形成詞典,以及如何選擇輸出格式以減小冗余。詞典編碼又可分為兩類:如何選擇輸出格式以減小冗余。詞典編碼又可分為兩類:l第一類詞典編碼的思想第一類詞典編碼的思想是:查找正在壓縮的字符序列是否在是:查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過(guò),然后用已經(jīng)出現(xiàn)過(guò)的字符串替代以前輸入的數(shù)據(jù)中出現(xiàn)過(guò),然后用已經(jīng)出現(xiàn)過(guò)的字符串替代重復(fù)的部分,并將指向重復(fù)字符串的指針作為輸出編碼。重復(fù)的部分,并將指向重復(fù)字符串的指針作為輸出編碼。指針P指向了重復(fù)字符串“abc”,所以,當(dāng)再次出現(xiàn)相同字符串時(shí),則輸出指針P。40第二類詞典編

29、碼l第二類詞典編碼的思想第二類詞典編碼的思想是:從輸入的數(shù)據(jù)中創(chuàng)是:從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)由短語(yǔ)組成的建一個(gè)由短語(yǔ)組成的“編碼詞典編碼詞典”,編碼數(shù)據(jù),編碼數(shù)據(jù)過(guò)程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的過(guò)程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語(yǔ)短語(yǔ)”時(shí),時(shí),編碼器就輸出這個(gè)詞典中短語(yǔ)的編碼器就輸出這個(gè)詞典中短語(yǔ)的“索引號(hào)索引號(hào)”,而不是短語(yǔ)本身,如下圖而不是短語(yǔ)本身,如下圖:41WAV文件格式lWAVWAV是是Microsoft WindowsMicrosoft Windows提供的音頻格式。這提供的音頻格式。這個(gè)格式是目前通用音頻格式,它通常用來(lái)保存?zhèn)€格式是目前通用音頻格式,它通常用來(lái)保存一些沒(méi)有壓縮的音頻。

30、目前所有的音頻播放軟一些沒(méi)有壓縮的音頻。目前所有的音頻播放軟件和編輯軟件都支持這一格式。件和編輯軟件都支持這一格式。lWAVWAV文件由三部分組成:文件頭文件由三部分組成:文件頭( (標(biāo)明是標(biāo)明是WAVWAV文文件、文件結(jié)構(gòu)和數(shù)據(jù)的總字節(jié)數(shù)件、文件結(jié)構(gòu)和數(shù)據(jù)的總字節(jié)數(shù)) )、數(shù)字化參、數(shù)字化參數(shù)數(shù)( (如采樣頻率、聲道數(shù)、編碼算法等如采樣頻率、聲道數(shù)、編碼算法等) ),最后,最后是實(shí)際波形數(shù)據(jù)。一般來(lái)說(shuō),聲音質(zhì)量與其是實(shí)際波形數(shù)據(jù)。一般來(lái)說(shuō),聲音質(zhì)量與其WAVWAV格式的文件大小成正比。格式的文件大小成正比。42MP3文件格式uMP3MP3是第一個(gè)實(shí)用的有損音頻壓縮編碼技術(shù)。在是第一個(gè)實(shí)用的有損音頻壓縮編碼技術(shù)。在MP3MP3出現(xiàn)之前,一般的音頻編碼即使以有損方式出現(xiàn)之前,一般的音頻編碼即使以有損方式進(jìn)行壓縮,能達(dá)到進(jìn)行壓縮,能達(dá)到4:14:1的壓縮比例已經(jīng)非常不錯(cuò)的壓縮比例已經(jīng)非常不錯(cuò)了。但是,了。但是,MP3MP3可以實(shí)現(xiàn)可以實(shí)現(xiàn)12:112:1的壓縮比例。的壓縮比例。u衡量衡量MP3MP3文件的壓縮比例通常使用比特率來(lái)表示。文件的壓縮比例通常使用比特率來(lái)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論