DB31T 1066-2017 四值圖像電子文檔壓縮算法_第1頁
DB31T 1066-2017 四值圖像電子文檔壓縮算法_第2頁
DB31T 1066-2017 四值圖像電子文檔壓縮算法_第3頁
DB31T 1066-2017 四值圖像電子文檔壓縮算法_第4頁
DB31T 1066-2017 四值圖像電子文檔壓縮算法_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

四值圖像電子文檔壓縮算法I前言 Ⅲ引言 12術(shù)語和定義 13四值圖像電子文檔壓縮的標準流程 24四值壓縮算法技術(shù)要求 25四值壓縮算法的應(yīng)用 3Ⅲ本標準按照GB/T1.1—2009給出的規(guī)則起草。本標準由上海市政府辦公廳電子政務(wù)辦公室提出并歸口。本標準由上海市政府辦公廳電子政務(wù)辦公室、上海金剛石數(shù)碼研究中心負責(zé)起草。為了滿足四值圖像電子文檔壓縮算法標準化需求,根據(jù)當(dāng)前使用的電子文檔(包括文本文件、電子文件的標準化的高效壓縮算法。采用本標準的TIFF圖像文件,作為電子政務(wù)與電子商務(wù)的電子文檔,可以繞過國外軟件企業(yè)知識1四值圖像電子文檔壓縮算法本標準適用于上海市電子政務(wù)與電子商務(wù)的四值電子文檔的產(chǎn)生與存檔。下列術(shù)語和定義適用于本文件。一種由若干行字符構(gòu)成的計算機文件作為一種容器存儲特定編碼格式的字符串。張尺寸不等的圖片組成的電子文檔。24Bit位圖24-Bitmap由RGB3個字節(jié)的位圖圖像(Bitmap),可以表達為2的24次方,約1600萬種顏色。將采用位圖技術(shù)且其顏色不超過四種的電子文檔,對其位圖像素點用2個Bit數(shù)字表示(預(yù)處理)注:反之,解壓縮過程也稱之為四值解壓縮。2壓縮比compressionratio電子文檔壓縮前后的體量大小之比。3四值圖像電子文檔壓縮的標準流程3.1文檔格式轉(zhuǎn)換等(圖像文件描述的表格和文字特殊應(yīng)用)四種顏色的文本文件、電子表單和數(shù)字憑證都轉(zhuǎn)為TIFF(24)圖像文件格式。選用TIFF(24)圖像文件格式,是因為它沒有版權(quán)障礙。而且,可以選用本標準的四值壓縮算法進行基于操作系統(tǒng)自動壓縮與解壓縮。3.2文檔格式特色轉(zhuǎn)換后的電子文檔具有以下特色:a)統(tǒng)一了電子政務(wù)和電子商務(wù)使用電子文檔格式;b)電子文檔在不同的計算機顯示器上顯示效果相同;c)確保電子文檔創(chuàng)建安全機制的可能性(TIFF文件中創(chuàng)建安全機制和加載安全信息的方法與流程另行描述),使得電子文檔使用更加安全;d)使得電子文檔(運用痕跡處理技術(shù)實現(xiàn),另行描述)既能讓人“看”得懂,又能讓計算機“讀”得懂;e)選擇TIFF圖像格式的位圖顏色深度為24Bit,位圖像素分別為R(紅色)、G(藍色)、B(綠色)各一個字節(jié)(8Bit)。這種位圖深度支持圖像的全真彩顯示。滿足電子文檔的各種應(yīng)用需要。3.3電子文檔壓縮算法本壓縮算法僅用于TIFF格式文件的位圖,文件頭部和文件屬性不實施數(shù)據(jù)壓縮。24Bit的像素可以表達22種顏色,而我們的電子文檔最多只有4種顏色,因此,就可能設(shè)計出有針對性、高壓縮比的壓縮算法(具體壓縮算法下一節(jié)詳細描述)。壓縮比高于其他壓縮算法。安裝一個小程序,它通過從微軟Windows操作系統(tǒng)的編譯器regedit,對系統(tǒng)注冊表中HKEY_CURRENT_USER鍵進行重新注冊,在HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Explorer\FileExts\TIFF子鍵中添加引導(dǎo)使用四值壓縮算法函數(shù)(壓縮與解壓縮函數(shù)),使得操作系統(tǒng)打開和關(guān)閉TIFF文檔時,就自動實施文件的壓縮與解壓縮。4四值壓縮算法技術(shù)要求4.1總則四值壓縮算法其實是一種復(fù)合壓縮算法,首先它對TIFF位圖進行“四值預(yù)壓縮”;然后,對經(jīng)過四值預(yù)壓縮后的數(shù)據(jù)進行字典壓縮(LZW),以取得較高的壓縮比。因為四值預(yù)壓縮與字典壓縮(LZW)都34.2四值預(yù)壓縮算法(綠)各一個字節(jié)(8Bit)。這種位圖支持圖像的全真彩顯示。滿足文本文件、票據(jù)與憑證的各種應(yīng)用24Bit的像素可以表達22種顏色,而電子文檔中位圖(也就是壓縮對象)只有不超過四種顏色(任24Bit用2Bit來表示。四值預(yù)壓縮的壓縮比為1/12,就是電子文檔體量OFF91.67%,縮小到原來的四值預(yù)壓縮算法是一種無損壓縮。字典壓縮算法通過建立字典,通過創(chuàng)建一個串表(串由一個前綴值與后綴值所組成。前綴是原始數(shù)據(jù)1字節(jié)內(nèi)容,或者是一個串表中已存在的數(shù)字串,后綴是原始數(shù)據(jù)1字節(jié)的內(nèi)容)。讀取原始數(shù)據(jù)組將這個串表的后綴變更為前綴;如果這個串已經(jīng)存在串表,就舍棄這個串的后綴,并將前綴變更為那個用來表示這個串的數(shù)字。之后,再接著讀取數(shù)據(jù),與之前留下的前綴組成一個串,并繼續(xù)進行上面的過程。這個串表會在壓縮后刪除,解壓時重建。四值解壓縮算法,是四值壓縮算法的逆行為(流程),首先對壓縮后位圖進行LZW算法的解壓縮,4.5四值壓縮文件保存4.5.1位圖的四種顏色(RGB值)存放在TIFF圖像文件50020屬性中。4.5.2壓縮算法選擇,存放在文件259屬性的值為0x0300010010,最后兩位“10”表示采用四值壓縮算法。4.5.4具體數(shù)據(jù)可以通過標準的讀取接口函數(shù)獲取。5四值壓縮算法的應(yīng)用5.1壓縮數(shù)據(jù)的定義與結(jié)構(gòu)四值。就是電子文檔的圖像位圖四種顏色。底色(一般接近白色,0xFFFFFF,數(shù)量最多);填寫文字(一般接近黑色,0x000000,數(shù)量次之);紅章,或者紅頭文字(一般接近紅色,0xFF0000,較少);紅章蓋在填寫文字上(一般接近紅色,0xFF0000,最少)。這四種顏色是默認值,工具軟件支持用戶修改。壓縮算法選擇。默認值為01表示未壓縮;02表示采用CCITTGroup3壓縮;03表示CCITT4壓縮(屬于游程編碼的一種為無損壓縮)。圖像四值數(shù)據(jù)結(jié)構(gòu):底色(0xFFFFFF)+填寫文字(0x000000)+紅章,或者紅頭文字(0xFF0000)+紅章蓋在填寫文字上(0xFF0000)。它們存放在50020屬性中。文件壓縮(編號259)屬性的值為0x03000100xx。其中xx值為=05,選擇LZW壓縮算法;其中xx值為=10,選擇四值壓縮算法。1)輸入?yún)?shù):位圖;unsignedchar*src3)輸出參數(shù):位圖壓縮數(shù)據(jù);unsignedchar*res4)輸出參數(shù):位圖壓縮數(shù)據(jù)長度;int&rescnt1)輸入?yún)?shù):位圖壓縮數(shù)據(jù);unsignedchar*srcb)返回值:0表示函數(shù)運行正常,-99表示函數(shù)運行失敗。2)輸出參數(shù):四值顏色1;result[0:2]1)輸入?yún)?shù):TIFF文件名稱;unsignedchar*filename

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論