03多媒體技術(shù)簡(jiǎn)介

上傳人：w*** IP屬地：山西上傳時(shí)間：2022-03-22 格式：PPT 頁(yè)數(shù)：46 大小：297KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩41頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1多媒體技術(shù)簡(jiǎn)介多媒體技術(shù)簡(jiǎn)介第三、四講2主要內(nèi)容主要內(nèi)容多媒體數(shù)據(jù)的獲取技術(shù)數(shù)字化技術(shù)編碼技術(shù)壓縮技術(shù)多媒體技術(shù)標(biāo)準(zhǔn)存儲(chǔ)格式。31 多媒體數(shù)據(jù)的獲取技術(shù)多媒體數(shù)據(jù)的獲取技術(shù)l計(jì)算機(jī)本身可以創(chuàng)建的媒體：文本、圖形、動(dòng)畫和MIDI音樂(lè)l從外部輸入到計(jì)算機(jī)內(nèi)的媒體：圖像、音頻和視頻l圖像、音頻和視頻這三種媒體需要數(shù)字化，才能讓計(jì)算機(jī)處理。42 數(shù)字化技術(shù)數(shù)字化技術(shù)l數(shù)字化：將模擬信號(hào)變成數(shù)字信號(hào)的過(guò)程l采樣：把連續(xù)時(shí)間或者連續(xù)空間分布轉(zhuǎn)化為離散值的過(guò)程，必須遵循奈奎斯特定理l量化：把連續(xù)的采樣值轉(zhuǎn)化為離散值的過(guò)程，分為線性量化和非線性量化l編碼：把量化值表示成數(shù)字形式的過(guò)程l音頻數(shù)字化、圖像數(shù)字化

2、、視頻數(shù)字化。53 編碼技術(shù)編碼技術(shù)l編碼模型l壓縮編碼分類l統(tǒng)計(jì)編碼：哈夫曼（哈夫曼（HuffmanHuffman）編碼、香農(nóng)）編碼、香農(nóng)- -費(fèi)諾編碼、費(fèi)諾編碼、算術(shù)編碼、游程編碼（算術(shù)編碼、游程編碼（RLCRLC）和）和LZWLZW編碼編碼( (第二類編碼第二類編碼) )l預(yù)測(cè)編碼l變換編碼l分形編碼l矢量化編碼l子帶編碼。64 壓縮技術(shù)壓縮技術(shù)l編碼壓縮的必要性與可能性編碼壓縮的必要性與可能性l多媒體數(shù)據(jù)存在著大量的冗余多媒體數(shù)據(jù)存在著大量的冗余:空間冗余、時(shí)空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺(jué)冗余、圖間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺(jué)冗余、圖像區(qū)域的相同性冗余和紋理的統(tǒng)計(jì)冗余像

3、區(qū)域的相同性冗余和紋理的統(tǒng)計(jì)冗余l(xiāng)文本壓縮技術(shù)文本壓縮技術(shù)l圖像壓縮技術(shù)圖像壓縮技術(shù)l音頻壓縮技術(shù)音頻壓縮技術(shù)l視頻壓縮技術(shù)。視頻壓縮技術(shù)。75 多媒體技術(shù)標(biāo)準(zhǔn)多媒體技術(shù)標(biāo)準(zhǔn)l多媒體壓縮標(biāo)準(zhǔn)l音頻壓縮標(biāo)準(zhǔn)l圖像壓縮標(biāo)準(zhǔn)l視頻壓縮標(biāo)準(zhǔn)l多媒體表示標(biāo)準(zhǔn)l同步多媒體集成語(yǔ)言lMHEG標(biāo)準(zhǔn)l多媒體元數(shù)據(jù)標(biāo)準(zhǔn)。86 存儲(chǔ)格式存儲(chǔ)格式l文本存儲(chǔ)格式：.doc、.rtf、.pdfl圖像存儲(chǔ)格式l音頻存儲(chǔ)格式: .WAVWAV、.MP3.MP3、.MID.MID、其它格式其它格式l視頻存儲(chǔ)格式。9音頻音頻幅幅值值t一個(gè)周期一個(gè)周期+空氣壓強(qiáng)空氣壓強(qiáng)0聲音包含三個(gè)要素：音調(diào)、音強(qiáng)和音色。聲音包含三個(gè)要素：音調(diào)、

4、音強(qiáng)和音色?；l與音調(diào)：一個(gè)聲源每秒鐘可產(chǎn)生成百上千個(gè)波，通常把每秒鐘波峰所產(chǎn)基頻與音調(diào)：一個(gè)聲源每秒鐘可產(chǎn)生成百上千個(gè)波，通常把每秒鐘波峰所產(chǎn)生的數(shù)目稱之為信號(hào)的頻率，單位用赫茲生的數(shù)目稱之為信號(hào)的頻率，單位用赫茲(Hz)或千赫茲或千赫茲(kHz)表示表示諧波與音色：諧波與音色：no稱為基波稱為基波o的的n次諧波分量次諧波分量(n就是高次諧波的方次，就是高次諧波的方次，no就是基波就是基波o的的n次諧波次諧波)，也稱為泛音。音色是由混入基音的泛音所決，也稱為泛音。音色是由混入基音的泛音所決定的定的幅度與音強(qiáng)：信號(hào)的幅度是從信號(hào)的基線到當(dāng)前波峰的距離。幅度決定了信幅度與音強(qiáng)：信號(hào)的幅度是從信號(hào)

5、的基線到當(dāng)前波峰的距離。幅度決定了信號(hào)音量的強(qiáng)弱程度。幅度越大，聲音越強(qiáng)。號(hào)音量的強(qiáng)弱程度。幅度越大，聲音越強(qiáng)。10音頻數(shù)字化音頻數(shù)字化l連續(xù)的音頻波形可通過(guò)麥克風(fēng)等輸入設(shè)備轉(zhuǎn)化為連續(xù)的電信號(hào)，要使計(jì)算機(jī)能夠處理和傳輸音頻信號(hào)，必須經(jīng)過(guò)模/數(shù)轉(zhuǎn)換過(guò)程l采樣。對(duì)聲音波形的采樣就是按采樣的頻率間隔、不斷地獲取幅度的量值，使連續(xù)的聲音波形轉(zhuǎn)變?yōu)殡x散的數(shù)字量l量化。將信號(hào)范圍分割成固定數(shù)量。11圖像數(shù)字化圖像數(shù)字化l采樣（Sampling）是對(duì)圖像空間坐標(biāo)的離散化，它決定了圖像的空間分辨率，就是用一個(gè)網(wǎng)格(如右圖所示)把待處理的圖像覆蓋，把每一小格上模擬圖像的各個(gè)亮度取平均值，作為該小方格中點(diǎn)的值

6、l把采樣后所得的各像素灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。12編碼壓縮的必要性與可能性編碼壓縮的必要性與可能性l眾所周知，多媒體量化所需數(shù)據(jù)量大。音頻、眾所周知，多媒體量化所需數(shù)據(jù)量大。音頻、圖像和視頻的龐大數(shù)據(jù)對(duì)計(jì)算機(jī)的處理速度、圖像和視頻的龐大數(shù)據(jù)對(duì)計(jì)算機(jī)的處理速度、存儲(chǔ)容量都提出過(guò)高的要求。因此必須進(jìn)行數(shù)存儲(chǔ)容量都提出過(guò)高的要求。因此必須進(jìn)行數(shù)據(jù)量壓縮據(jù)量壓縮l從傳送的角度來(lái)看，在信道帶寬、通信鏈路容從傳送的角度來(lái)看，在信道帶寬、通信鏈路容量一定的前提下，采用編碼壓縮技術(shù)，減少傳量一定的前提下，采用編碼壓縮技術(shù)，減少傳輸數(shù)據(jù)量，是提高通信速度的重要手段。因此，輸數(shù)據(jù)量，是提高

7、通信速度的重要手段。因此，更要求數(shù)據(jù)量壓縮。更要求數(shù)據(jù)量壓縮。13多媒體數(shù)據(jù)存在著大量的冗余多媒體數(shù)據(jù)存在著大量的冗余l(xiāng)眾所周知，視頻由一幀一幀的圖像組成，眾所周知，視頻由一幀一幀的圖像組成，而圖像的各像素之間，無(wú)論是在行方向而圖像的各像素之間，無(wú)論是在行方向還是在列方向，都存在著一定的相關(guān)性，還是在列方向，都存在著一定的相關(guān)性，即冗余度。應(yīng)用某種編碼方法提取或減即冗余度。應(yīng)用某種編碼方法提取或減少這些冗余度，便可以達(dá)到壓縮數(shù)據(jù)的少這些冗余度，便可以達(dá)到壓縮數(shù)據(jù)的目的。目的。14圖形圖形l圖形不直接描述數(shù)據(jù)的每一點(diǎn)，而是描述產(chǎn)生這些點(diǎn)的過(guò)程與方法，在計(jì)算機(jī)圖形學(xué)和數(shù)字圖像處理中，圖像是位圖的概

8、念，基本元素是像素；圖形則是向量圖的概念，基本元素是圖元，即圖形指令。15圖像圖像16編碼模型編碼模型(圖像圖像)一個(gè)壓縮系統(tǒng)包括兩個(gè)不同的結(jié)構(gòu)塊：一個(gè)編碼器和一個(gè)解碼器一個(gè)壓縮系統(tǒng)包括兩個(gè)不同的結(jié)構(gòu)塊：一個(gè)編碼器和一個(gè)解碼器從原理來(lái)看主要分為三個(gè)階段，第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入從原理來(lái)看主要分為三個(gè)階段，第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設(shè)法去除原圖象信號(hào)的相關(guān)性，圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設(shè)法去除原圖象信號(hào)的相關(guān)性，例如對(duì)電視信號(hào)就可以去掉幀內(nèi)各種相關(guān)，還可以去除幀間相關(guān)。這樣有例如對(duì)電視信號(hào)就可以去掉幀內(nèi)各種相關(guān)，還可以去除幀

9、間相關(guān)。這樣有利于編碼壓縮。第三階段就是找一種更近于熵，又利于計(jì)算機(jī)處理的編碼利于編碼壓縮。第三階段就是找一種更近于熵，又利于計(jì)算機(jī)處理的編碼方式。方式。17壓縮編碼分類壓縮編碼分類18統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼l統(tǒng)計(jì)編碼屬無(wú)損編碼，它是根據(jù)消息出現(xiàn)概率統(tǒng)計(jì)編碼屬無(wú)損編碼，它是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼。統(tǒng)計(jì)編碼又可的分布特性而進(jìn)行的壓縮編碼。統(tǒng)計(jì)編碼又可分為定長(zhǎng)碼和變長(zhǎng)碼，常分為如下幾類：分為定長(zhǎng)碼和變長(zhǎng)碼，常分為如下幾類：l哈夫曼（哈夫曼（HuffmanHuffman）編碼）編碼l香農(nóng)香農(nóng)- -費(fèi)諾編碼費(fèi)諾編碼l算術(shù)編碼算術(shù)編碼l游程編碼（游程編碼（RLCRLC）lLZWLZW編碼。

10、編碼。19預(yù)測(cè)編碼預(yù)測(cè)編碼l預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在著一定的相關(guān)性，預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在著一定的相關(guān)性，利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一信號(hào)進(jìn)行預(yù)測(cè)，然利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一信號(hào)進(jìn)行預(yù)測(cè)，然后對(duì)實(shí)際值和預(yù)測(cè)值的差后對(duì)實(shí)際值和預(yù)測(cè)值的差( (預(yù)測(cè)誤差預(yù)測(cè)誤差) )進(jìn)行編碼進(jìn)行編碼l預(yù)測(cè)編碼中典型的壓縮方法有脈沖編碼調(diào)制預(yù)測(cè)編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM, (PCM, Pulse Code Modulation)Pulse Code Modulation)、差分脈沖編碼調(diào)制、差分脈沖編碼調(diào)制(DPCM(DPCM，Differential Pulse Code Mo

11、dulation)Differential Pulse Code Modulation)、自適應(yīng)差、自適應(yīng)差分脈沖編碼調(diào)制分脈沖編碼調(diào)制(ADPCM(ADPCM，Adaptive Differential Adaptive Differential Pulse Code Modulation)Pulse Code Modulation)等等l預(yù)測(cè)編碼可分為無(wú)損預(yù)測(cè)編碼和有損預(yù)測(cè)編碼。預(yù)測(cè)編碼可分為無(wú)損預(yù)測(cè)編碼和有損預(yù)測(cè)編碼。20變換編碼變換編碼l變換編碼的原理如右圖所示。從圖中看出，變換編碼的原理如右圖所示。從圖中看出，存儲(chǔ)或傳輸都是在變換域中進(jìn)行的，即傳存儲(chǔ)或傳輸都是在變換域中進(jìn)行的，即傳輸

12、或存儲(chǔ)都不是空域圖像而是變換域系數(shù)，輸或存儲(chǔ)都不是空域圖像而是變換域系數(shù)，分一般正交變換和小波變換。分一般正交變換和小波變換。21分形編碼分形編碼l分形編碼與分形幾何相關(guān)。所謂分形幾何就是研究無(wú)限復(fù)雜分形編碼與分形幾何相關(guān)。所謂分形幾何就是研究無(wú)限復(fù)雜但具有一定意義下的自相似圖形和結(jié)構(gòu)的幾何學(xué)。分形編碼但具有一定意義下的自相似圖形和結(jié)構(gòu)的幾何學(xué)。分形編碼正是利用分形幾何中自相似的原理來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮的。首先正是利用分形幾何中自相似的原理來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮的。首先對(duì)圖像進(jìn)行分塊，然后再去尋找各塊之間的相似性，這里相對(duì)圖像進(jìn)行分塊，然后再去尋找各塊之間的相似性，這里相似性的描述主要是依靠仿射變換來(lái)確定的

13、，一旦找到了每塊似性的描述主要是依靠仿射變換來(lái)確定的，一旦找到了每塊的仿射變換，就保存下這個(gè)仿射變換的系數(shù)，由于每塊的數(shù)的仿射變換，就保存下這個(gè)仿射變換的系數(shù)，由于每塊的數(shù)據(jù)量遠(yuǎn)大于仿射變換的系數(shù)，因而圖像得以大幅度地壓縮據(jù)量遠(yuǎn)大于仿射變換的系數(shù)，因而圖像得以大幅度地壓縮 l分形圖像編碼和解碼不夠成熟，產(chǎn)生的壓縮比不夠高。壓縮分形圖像編碼和解碼不夠成熟，產(chǎn)生的壓縮比不夠高。壓縮效果還不十分理想，在當(dāng)前圖像壓縮編碼中還不能占據(jù)主導(dǎo)效果還不十分理想，在當(dāng)前圖像壓縮編碼中還不能占據(jù)主導(dǎo)地位。地位。22子帶編碼子帶編碼l由于人眼對(duì)不同頻域段的敏感程度不同，圖像由于人眼對(duì)不同頻域段的敏感程度不同，圖像信

14、號(hào)可以劃分為不同的頻域段。子帶編碼的基信號(hào)可以劃分為不同的頻域段。子帶編碼的基本思想是利用一濾波器組，將采樣將輸入信號(hào)本思想是利用一濾波器組，將采樣將輸入信號(hào)分解為高頻分量和低頻分量，然后分別對(duì)高頻分解為高頻分量和低頻分量，然后分別對(duì)高頻和低頻分量進(jìn)行量化和編碼。解碼時(shí)，高頻分和低頻分量進(jìn)行量化和編碼。解碼時(shí)，高頻分量和低頻分量經(jīng)過(guò)插值和共軛濾波器而合成原量和低頻分量經(jīng)過(guò)插值和共軛濾波器而合成原信號(hào)。信號(hào)。23矢量化編碼矢量化編碼l矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)性，將輸入圖像數(shù)據(jù)序列分組，每一組由性，將輸入圖像數(shù)據(jù)序列分組，每一組由m m個(gè)個(gè)數(shù)

15、據(jù)構(gòu)成一個(gè)數(shù)據(jù)構(gòu)成一個(gè)M M維矢量，一起進(jìn)行編碼，即一維矢量，一起進(jìn)行編碼，即一次量化多個(gè)點(diǎn)。根據(jù)香農(nóng)失真率理論，對(duì)于無(wú)次量化多個(gè)點(diǎn)。根據(jù)香農(nóng)失真率理論，對(duì)于無(wú)記憶信源，矢量量化編碼總是優(yōu)于標(biāo)量量化編記憶信源，矢量量化編碼總是優(yōu)于標(biāo)量量化編碼，矢量量化編碼是有損編碼。碼，矢量量化編碼是有損編碼。24文本壓縮技術(shù)文本壓縮技術(shù)l文本壓縮必須是無(wú)損壓縮l哈夫曼（哈夫曼（HuffmanHuffman）編碼）編碼l詞典編碼詞典編碼lLZ77LZ77lLZWLZW。25圖像壓縮技術(shù)圖像壓縮技術(shù)l典型的圖像壓縮系統(tǒng)主要由三部分組成：變換部分、量化部分和編碼部分26音頻壓縮技術(shù)音頻壓縮技術(shù)l音頻信息編碼技術(shù)主

16、要可分為三類音頻信息編碼技術(shù)主要可分為三類波形編碼：這種方法主要基于語(yǔ)音波形預(yù)測(cè)，它力圖使重建的語(yǔ)音波波形編碼：這種方法主要基于語(yǔ)音波形預(yù)測(cè)，它力圖使重建的語(yǔ)音波形保持原有的波形狀態(tài)。常用的波形編碼技術(shù)有增量調(diào)制形保持原有的波形狀態(tài)。常用的波形編碼技術(shù)有增量調(diào)制(DM)(DM)、自適、自適應(yīng)差分脈沖編碼調(diào)制應(yīng)差分脈沖編碼調(diào)制(ADPCM)(ADPCM)、子帶編碼、子帶編碼(SBC)(SBC)和矢量量化編碼和矢量量化編碼(VQ)(VQ)等等等等參數(shù)編碼：參數(shù)編碼的方法是將音頻信號(hào)以某種模型表示，再抽出合參數(shù)編碼：參數(shù)編碼的方法是將音頻信號(hào)以某種模型表示，再抽出合適的模型參數(shù)和參考激勵(lì)信號(hào)進(jìn)行編碼

17、；聲音重放時(shí)，再根據(jù)這些參適的模型參數(shù)和參考激勵(lì)信號(hào)進(jìn)行編碼；聲音重放時(shí)，再根據(jù)這些參數(shù)重建即可。顯然參數(shù)編碼壓縮比很高，但計(jì)算量大。它主要用于在數(shù)重建即可。顯然參數(shù)編碼壓縮比很高，但計(jì)算量大。它主要用于在窄帶信道上提供窄帶信道上提供4.8kb/s4.8kb/s以下的低速語(yǔ)音通信和一些對(duì)延時(shí)要求較寬以下的低速語(yǔ)音通信和一些對(duì)延時(shí)要求較寬的應(yīng)用場(chǎng)合（如衛(wèi)星通信等）。最常用的參數(shù)編碼法為線性預(yù)測(cè)的應(yīng)用場(chǎng)合（如衛(wèi)星通信等）。最常用的參數(shù)編碼法為線性預(yù)測(cè)（LPCLPC）編碼）編碼混合編碼：是指同時(shí)使用兩種或兩種以上的編碼方法進(jìn)行編碼的過(guò)程?；旌暇幋a：是指同時(shí)使用兩種或兩種以上的編碼方法進(jìn)行編碼的過(guò)程。

18、由于每種編碼方法都有自己的優(yōu)勢(shì)和不足，若是用兩種或兩種以上的由于每種編碼方法都有自己的優(yōu)勢(shì)和不足，若是用兩種或兩種以上的編碼方法進(jìn)行編碼，可以優(yōu)勢(shì)互補(bǔ)，克服各自的不足，從而達(dá)到高效編碼方法進(jìn)行編碼，可以優(yōu)勢(shì)互補(bǔ)，克服各自的不足，從而達(dá)到高效數(shù)據(jù)壓縮的目的。數(shù)據(jù)壓縮的目的。27視頻壓縮技術(shù)視頻壓縮技術(shù)l視頻壓縮技術(shù)兩個(gè)要點(diǎn)：l在空間上，圖像數(shù)據(jù)采用JPEG壓縮算法l在時(shí)間上，圖像數(shù)據(jù)采用移動(dòng)補(bǔ)償算法l三種圖像lI圖像利用圖像自身的相關(guān)性壓縮, 提供壓縮數(shù)據(jù)流中的隨機(jī)存取的點(diǎn)，采用基于ADCT的編碼技術(shù)，壓縮后，每個(gè)像素為1b-2blP圖像用最近的前一個(gè)I圖像(或P圖像)預(yù)測(cè)編碼得到(前向預(yù)測(cè)

19、)lB圖像 B圖像在預(yù)測(cè)時(shí), 既可使用了前一個(gè)圖像作參照, 也可使用下一個(gè)圖像做參照或同時(shí)使用前后兩個(gè)圖像作為參照?qǐng)D像(雙向預(yù)測(cè))。28空間冗余l(xiāng)這是靜態(tài)圖像存在的最主要的一種這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄了畫面上數(shù)據(jù)冗余。一幅圖像記錄了畫面上可見(jiàn)景物的顏色。同一景物表面上可見(jiàn)景物的顏色。同一景物表面上各采樣點(diǎn)的顏色之間往往存在著空各采樣點(diǎn)的顏色之間往往存在著空間連貫性，從而產(chǎn)生了空間冗余。間連貫性，從而產(chǎn)生了空間冗余。29時(shí)間冗余l(xiāng)在視頻的相鄰幀間，往往包含相同的背景和移在視頻的相鄰幀間，往往包含相同的背景和移動(dòng)物體，因此，后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有許動(dòng)物體，因此，后一幀

20、數(shù)據(jù)與前一幀數(shù)據(jù)有許多共同的地方，即在時(shí)間上存在大量的冗余。多共同的地方，即在時(shí)間上存在大量的冗余。30結(jié)構(gòu)冗余l(xiāng)在有些圖像的紋理區(qū)，圖像的像素值存在著明在有些圖像的紋理區(qū)，圖像的像素值存在著明顯的分布模式。例如，方格狀的地板圖案等。顯的分布模式。例如，方格狀的地板圖案等。我們稱這種冗余為結(jié)構(gòu)冗余。我們稱這種冗余為結(jié)構(gòu)冗余。31知識(shí)冗余l(xiāng)有些圖像的理解與某些知識(shí)有相當(dāng)大的相關(guān)性。有些圖像的理解與某些知識(shí)有相當(dāng)大的相關(guān)性。例如，人臉的圖像有固定的結(jié)構(gòu)。這類規(guī)律性例如，人臉的圖像有固定的結(jié)構(gòu)。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到，我們稱的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到，我們稱此類冗余為知識(shí)冗

21、余。此類冗余為知識(shí)冗余。32視覺(jué)冗余l(xiāng)事實(shí)表明，人類的視覺(jué)系統(tǒng)對(duì)圖像場(chǎng)的敏感性事實(shí)表明，人類的視覺(jué)系統(tǒng)對(duì)圖像場(chǎng)的敏感性是非均勻的和非線性的。然而，在記錄原始圖是非均勻的和非線性的。然而，在記錄原始圖像數(shù)據(jù)時(shí)，通常假定視覺(jué)系統(tǒng)是線性的和均勻像數(shù)據(jù)時(shí)，通常假定視覺(jué)系統(tǒng)是線性的和均勻的，對(duì)視覺(jué)敏感和不敏感的部分同等對(duì)待，從的，對(duì)視覺(jué)敏感和不敏感的部分同等對(duì)待，從而產(chǎn)生了比理想編碼更多的數(shù)據(jù)，這就是視覺(jué)而產(chǎn)生了比理想編碼更多的數(shù)據(jù)，這就是視覺(jué)冗余。冗余。33圖像區(qū)域的相同性冗余l(xiāng)是指在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有是指在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有像素值相同或相近，從而產(chǎn)生的數(shù)據(jù)重復(fù)性存像素

22、值相同或相近，從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲(chǔ)，這就是圖像區(qū)域的相似性冗余。儲(chǔ)，這就是圖像區(qū)域的相似性冗余。34紋理的統(tǒng)計(jì)冗余l(xiāng)有些圖像紋理盡管不嚴(yán)格服從某有些圖像紋理盡管不嚴(yán)格服從某分布規(guī)律，分布規(guī)律，但是它在統(tǒng)計(jì)的意義上服從該規(guī)律。利用這種但是它在統(tǒng)計(jì)的意義上服從該規(guī)律。利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量，所以我們性質(zhì)也可以減少表示圖像的數(shù)據(jù)量，所以我們稱之為紋理的統(tǒng)計(jì)冗余。稱之為紋理的統(tǒng)計(jì)冗余。35哈夫曼（Huffman）編碼l其編碼思想與其編碼思想與Shannon-Fano編碼方法基本一致，編碼方法基本一致，但構(gòu)造二叉樹(shù)的方法則相反，不是自上而下，而是但構(gòu)造二叉樹(shù)的方法則相反，不是自上而下

23、，而是自下而上、從樹(shù)葉到樹(shù)根生成二叉樹(shù)。具體編碼過(guò)自下而上、從樹(shù)葉到樹(shù)根生成二叉樹(shù)。具體編碼過(guò)程如下：程如下：l將信源符號(hào)按概率遞減順序排列；將信源符號(hào)按概率遞減順序排列；l把兩個(gè)最小的概率加起來(lái)，作為新符號(hào)的概率；把兩個(gè)最小的概率加起來(lái)，作為新符號(hào)的概率；l重復(fù)步驟（重復(fù)步驟（1）和（）和（2），直到概率達(dá)到），直到概率達(dá)到“1”為止；為止；l在每次合并消息時(shí)，將被合并的消息賦于在每次合并消息時(shí)，將被合并的消息賦于“1”和和“0”或或“0”和和“l(fā)”；l尋找從每一信源符號(hào)到概率為尋找從每一信源符號(hào)到概率為“1”處的路徑，記錄下路徑處的路徑，記錄下路徑上的上的“l(fā)”和和“0”；1.對(duì)每一符號(hào)寫

24、出從碼樹(shù)的根到終結(jié)點(diǎn)的對(duì)每一符號(hào)寫出從碼樹(shù)的根到終結(jié)點(diǎn)的“l(fā)”、“0”序列。序列。36香農(nóng)-費(fèi)諾編碼簡(jiǎn)稱為簡(jiǎn)稱為S-F編碼，是一種變長(zhǎng)編碼，其基本思想編碼，是一種變長(zhǎng)編碼，其基本思想是按信源符號(hào)出現(xiàn)的概率大小進(jìn)行排序，出現(xiàn)概是按信源符號(hào)出現(xiàn)的概率大小進(jìn)行排序，出現(xiàn)概率大的分配短碼，反之則分配長(zhǎng)碼。具體編碼過(guò)率大的分配短碼，反之則分配長(zhǎng)碼。具體編碼過(guò)程如下：程如下： l信源符號(hào)按概率遞減順序排列。信源符號(hào)按概率遞減順序排列。l把符號(hào)序列分成上下兩部分，使上下兩部分的概率和相把符號(hào)序列分成上下兩部分，使上下兩部分的概率和相等或接近相等。等或接近相等。l對(duì)上部分子序列編碼為對(duì)上部分子序列編碼為“0”

25、，相當(dāng)于左子樹(shù)，對(duì)下部分，相當(dāng)于左子樹(shù)，對(duì)下部分子序列編碼為子序列編碼為“1”，相當(dāng)于右子樹(shù)，相當(dāng)于右子樹(shù)l重復(fù)上述步驟，直到每個(gè)子序列只包含一個(gè)符號(hào)為止。重復(fù)上述步驟，直到每個(gè)子序列只包含一個(gè)符號(hào)為止。 37算術(shù)編碼算術(shù)編碼也是一種信息熵編碼方法，它用算術(shù)編碼也是一種信息熵編碼方法，它用0到到1之間的一個(gè)實(shí)數(shù)對(duì)輸入的信息進(jìn)行編碼。用到之間的一個(gè)實(shí)數(shù)對(duì)輸入的信息進(jìn)行編碼。用到兩個(gè)基本的參數(shù)，一是信源符號(hào)的概率，二是兩個(gè)基本的參數(shù)，一是信源符號(hào)的概率，二是信源符號(hào)對(duì)應(yīng)和編碼區(qū)間。一般的信源符號(hào)集信源符號(hào)對(duì)應(yīng)和編碼區(qū)間。一般的信源符號(hào)集x可表示為：可表示為：38游程編碼（RLC）l行程編碼（行程

26、編碼（RLE）通過(guò)統(tǒng)計(jì)信源符號(hào)中的重復(fù)個(gè)數(shù)，）通過(guò)統(tǒng)計(jì)信源符號(hào)中的重復(fù)個(gè)數(shù)，并以并以格式來(lái)編碼。適用于壓格式來(lái)編碼。適用于壓縮包含大量重復(fù)信息的信源。其基本思想是：按行存縮包含大量重復(fù)信息的信源。其基本思想是：按行存儲(chǔ)一個(gè)顏色值和相同色值的像素個(gè)數(shù)，如下圖。儲(chǔ)一個(gè)顏色值和相同色值的像素個(gè)數(shù)，如下圖。(a) 圖像示例（168像素）0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0

27、 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0(b) 示例圖像的像素值（168像素） 16 0 02 0 11 01 03 0 02 0 01 01 13 0 02 0 01 01 13 0 02 0 01 01 13 0 02 0 11 01 03 0 16 0 16 0(c) RLE編碼39LZW編碼l詞典編碼主要是利用編碼數(shù)據(jù)本身存在字符串重復(fù)特性來(lái)實(shí)詞典編碼主要是利用編碼數(shù)據(jù)本身存在字符串重復(fù)特性來(lái)實(shí)現(xiàn)數(shù)據(jù)壓

28、縮的。算法的核心就是如何動(dòng)態(tài)地形成詞典，以及現(xiàn)數(shù)據(jù)壓縮的。算法的核心就是如何動(dòng)態(tài)地形成詞典，以及如何選擇輸出格式以減小冗余。詞典編碼又可分為兩類：如何選擇輸出格式以減小冗余。詞典編碼又可分為兩類：l第一類詞典編碼的思想第一類詞典編碼的思想是：查找正在壓縮的字符序列是否在是：查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過(guò)，然后用已經(jīng)出現(xiàn)過(guò)的字符串替代以前輸入的數(shù)據(jù)中出現(xiàn)過(guò)，然后用已經(jīng)出現(xiàn)過(guò)的字符串替代重復(fù)的部分，并將指向重復(fù)字符串的指針作為輸出編碼。重復(fù)的部分，并將指向重復(fù)字符串的指針作為輸出編碼。指針P指向了重復(fù)字符串“abc”，所以，當(dāng)再次出現(xiàn)相同字符串時(shí)，則輸出指針P。40第二類詞典編

29、碼l第二類詞典編碼的思想第二類詞典編碼的思想是：從輸入的數(shù)據(jù)中創(chuàng)是：從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)由短語(yǔ)組成的建一個(gè)由短語(yǔ)組成的“編碼詞典編碼詞典”，編碼數(shù)據(jù)，編碼數(shù)據(jù)過(guò)程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的過(guò)程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語(yǔ)短語(yǔ)”時(shí)，時(shí)，編碼器就輸出這個(gè)詞典中短語(yǔ)的編碼器就輸出這個(gè)詞典中短語(yǔ)的“索引號(hào)索引號(hào)”，而不是短語(yǔ)本身，如下圖而不是短語(yǔ)本身，如下圖:41WAV文件格式lWAVWAV是是Microsoft WindowsMicrosoft Windows提供的音頻格式。這提供的音頻格式。這個(gè)格式是目前通用音頻格式，它通常用來(lái)保存?zhèn)€格式是目前通用音頻格式，它通常用來(lái)保存一些沒(méi)有壓縮的音頻。

30、目前所有的音頻播放軟一些沒(méi)有壓縮的音頻。目前所有的音頻播放軟件和編輯軟件都支持這一格式。件和編輯軟件都支持這一格式。lWAVWAV文件由三部分組成：文件頭文件由三部分組成：文件頭( (標(biāo)明是標(biāo)明是WAVWAV文文件、文件結(jié)構(gòu)和數(shù)據(jù)的總字節(jié)數(shù)件、文件結(jié)構(gòu)和數(shù)據(jù)的總字節(jié)數(shù)) )、數(shù)字化參、數(shù)字化參數(shù)數(shù)( (如采樣頻率、聲道數(shù)、編碼算法等如采樣頻率、聲道數(shù)、編碼算法等) )，最后，最后是實(shí)際波形數(shù)據(jù)。一般來(lái)說(shuō)，聲音質(zhì)量與其是實(shí)際波形數(shù)據(jù)。一般來(lái)說(shuō)，聲音質(zhì)量與其WAVWAV格式的文件大小成正比。格式的文件大小成正比。42MP3文件格式uMP3MP3是第一個(gè)實(shí)用的有損音頻壓縮編碼技術(shù)。在是第一個(gè)實(shí)用的有損音頻壓縮編碼技術(shù)。在MP3MP3出現(xiàn)之前，一般的音頻編碼即使以有損方式出現(xiàn)之前，一般的音頻編碼即使以有損方式進(jìn)行壓縮，能達(dá)到進(jìn)行壓縮，能達(dá)到4:14:1的壓縮比例已經(jīng)非常不錯(cuò)的壓縮比例已經(jīng)非常不錯(cuò)了。但是，了。但是，MP3MP3可以實(shí)現(xiàn)可以實(shí)現(xiàn)12:112:1的壓縮比例。的壓縮比例。u衡量衡量MP3MP3文件的壓縮比例通常使用比特率來(lái)表示。文件的壓縮比例通常使用比特率來(lái)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

03多媒體技術(shù)簡(jiǎn)介

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

03多媒體技術(shù)簡(jiǎn)介

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔