數(shù)據(jù)壓縮的方式非常多,不同特點(diǎn)的數(shù)據(jù)有不同的數(shù)據(jù)壓縮方式(也就是編碼方式),下面從幾個(gè)方面對(duì)其進(jìn)行分類。
(1)即時(shí)壓縮和非即時(shí)壓縮
比如打IP電話,就是將語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),同時(shí)進(jìn)行壓縮,然后通過(guò)Internet傳送出去,這個(gè)數(shù)據(jù)壓縮的過(guò)程是即時(shí)進(jìn)行的。即時(shí)壓縮一般應(yīng)用在影像、聲音數(shù)據(jù)的傳送中。即時(shí)壓縮常用到專門的硬件設(shè)備,如壓縮卡等。
非即時(shí)壓縮是計(jì)算機(jī)用戶經(jīng)常用到的,這種壓縮在需要的情況下才進(jìn)行,沒(méi)有即時(shí)性。例如壓縮一張圖片、一篇文章、一段音樂(lè)等。非即時(shí)壓縮一般不需要專門的設(shè)備,直接在計(jì)算機(jī)中安裝并使用相應(yīng)的壓縮軟件就可以了。
(2)數(shù)據(jù)壓縮和文件壓縮
其實(shí)數(shù)據(jù)壓縮包含了文件壓縮,數(shù)據(jù)本來(lái)是泛指任何數(shù)字化的信息,包括計(jì)算機(jī)中用到的各種文件,但有時(shí),數(shù)據(jù)是專指一些具有時(shí)間性的數(shù)據(jù),這些數(shù)據(jù)常常是即時(shí)采集、即時(shí)處理或傳輸?shù)?。而文件壓縮就是專指對(duì)將要保存在磁盤等物理介質(zhì)的數(shù)據(jù)進(jìn)行壓縮,如一篇文章數(shù)據(jù)、一段音樂(lè)數(shù)據(jù)、一段程序編碼數(shù)據(jù)等的壓縮。
(3)無(wú)損壓縮與有損壓縮
無(wú)損壓縮利用數(shù)據(jù)的統(tǒng)計(jì)冗余進(jìn)行壓縮。數(shù)據(jù)統(tǒng)計(jì)冗余度的理論限制為2:1到5:1,所以無(wú)損壓縮的壓縮比一般比較低。這類方法廣泛應(yīng)用于文本數(shù)據(jù)、程序和特殊應(yīng)用場(chǎng)合的圖像數(shù)據(jù)等需要精確存儲(chǔ)數(shù)據(jù)的壓縮。有損壓縮方法利用了人類視覺(jué)、聽(tīng)覺(jué)對(duì)圖像、聲音中的某些頻率成分不敏感的特性,允許壓縮的過(guò)程中損失一定的信息。雖然不能完全恢復(fù)原始數(shù)據(jù),但是所損失的部分對(duì)理解原始圖像的影響較小,卻換來(lái)了比較大的壓縮比。有損壓縮廣泛應(yīng)用于語(yǔ)音、圖像和視頻數(shù)據(jù)的壓縮。
對(duì)于任何形式的通信來(lái)說(shuō),只有當(dāng)信息的發(fā)送方和接受方都能夠理解編碼機(jī)制的時(shí)候壓縮數(shù)據(jù)通信才能夠工作。例如,只有當(dāng)接受方知道這篇文章需要用英語(yǔ)字符解釋的時(shí)候這篇文章才有意義。同樣,只有當(dāng)接受方知道編碼方法的時(shí)候他才能夠理解壓縮數(shù)據(jù)。一些壓縮算法利用了這個(gè)特性,在壓縮過(guò)程中對(duì)數(shù)據(jù)進(jìn)行加密,例如利用密碼加密,以保證只有得到授權(quán)的一方才能正確地得到數(shù)據(jù)。
數(shù)據(jù)壓縮能夠?qū)崿F(xiàn)是因?yàn)槎鄶?shù)現(xiàn)實(shí)世界的數(shù)據(jù)都有統(tǒng)計(jì)冗余。例如,字母“e”在英語(yǔ)中比字母“z”更加常用,字母“q”后面是“z”的可能性非常小。無(wú)損壓縮算法通常利用了統(tǒng)計(jì)冗余,這樣就能更加簡(jiǎn)練地、但仍然是完整地表示發(fā)送方的數(shù)據(jù)。
如果允許一定程度的保真度損失,那么還可以實(shí)現(xiàn)進(jìn)一步的壓縮。例如,人們看圖畫或者電視畫面的時(shí)候可能并不會(huì)注意到一些細(xì)節(jié)并不完善。同樣,兩個(gè)音頻錄音采樣序列可能聽(tīng)起來(lái)一樣,但實(shí)際上并不完全一樣。有損壓縮算法在帶來(lái)微小差別的情況下使用較少的位數(shù)表示圖像、視頻或者音頻。
由于可以幫助減少如硬盤空間與連接帶寬這樣的昂貴資源的消耗,所以壓縮非常重要,然而壓縮需要消耗信息處理資源,這也可能是費(fèi)用昂貴的。所以數(shù)據(jù)壓縮機(jī)制的設(shè)計(jì)需要在壓縮能力、失真度、所需計(jì)算資源以及其它需要考慮的不同因素之間進(jìn)行折衷。
一些機(jī)制是可逆的,這樣就可以恢復(fù)原始的數(shù)據(jù),這種機(jī)制稱為無(wú)損數(shù)據(jù)壓縮;另外一些機(jī)制為了實(shí)現(xiàn)更高的壓縮率允許一定程度的數(shù)據(jù)損失,這種機(jī)制稱為有損數(shù)據(jù)壓縮。
然而,經(jīng)常有一些文件不能被無(wú)損數(shù)據(jù)壓縮算法壓縮,實(shí)際上對(duì)于不含可以辨別樣式的數(shù)據(jù)任何壓縮算法都不能壓縮。試圖壓縮已經(jīng)經(jīng)過(guò)壓縮的數(shù)據(jù)通常得到的結(jié)果實(shí)際上是擴(kuò)展數(shù)據(jù),試圖壓縮經(jīng)過(guò)加密的數(shù)據(jù)通常也會(huì)得到這種結(jié)果。
實(shí)際上,有損數(shù)據(jù)壓縮也會(huì)最終達(dá)到不能工作的地步。我們來(lái)舉一個(gè)極端的例子,壓縮算法每次去掉文件最后一個(gè)字節(jié),那么經(jīng)過(guò)這個(gè)算法不斷的壓縮直至文件變空,壓縮算法將不能繼續(xù)工作。
事實(shí)上,多媒體信息存在許多數(shù)據(jù)冗余。例如,一幅圖像中的靜止建筑背景、藍(lán)天和綠地,其中許多像素是相同的如果逐點(diǎn)存儲(chǔ),就會(huì)浪費(fèi)許多空間,這稱為空間冗余。又如,在電視和動(dòng)畫的相鄰序列中,只有運(yùn)動(dòng)物體有少許變化,僅存儲(chǔ)差異部分即可,這稱為時(shí)間冗余。此外還有結(jié)構(gòu)冗余、視覺(jué)冗余等,這就為數(shù)據(jù)壓縮提供了條件。
總之,壓縮的理論基礎(chǔ)是信息論。從信息的角度來(lái)看,壓縮就是去除掉信息中的冗余,即去除掉確定的或可推知的信息,而保留不確定的信息,也就是用一種更接近信息本質(zhì)的描述來(lái)代替原有的冗余的描述,這個(gè)本質(zhì)的東西就是信息量。
數(shù)據(jù)壓縮 在計(jì)算機(jī)科學(xué)和信息論中,數(shù)據(jù)壓縮或者源編碼是按照特定的編碼機(jī)制用比未經(jīng)編碼少的數(shù)據(jù)位元(或者其它信息相關(guān)的單位)表示信息的過(guò)程。例如,如果我們將“compression”編碼為“c...
首先介紹壓縮機(jī)按結(jié)構(gòu)形式的不同分類如下:1、按其原理可分為:往復(fù)式(活塞式)壓縮機(jī);回轉(zhuǎn)式(旋轉(zhuǎn)式)壓縮機(jī);(渦輪式、水環(huán)式、透平)壓縮機(jī);軸流式壓縮機(jī);噴射式壓縮機(jī)及螺桿壓縮機(jī)等各種型式。2、按壓縮...
請(qǐng)問(wèn)數(shù)據(jù)機(jī)頂盒有哪些分類?
第一類稱為基本型機(jī)頂盒,能滿足免費(fèi)數(shù)字電視業(yè)務(wù)和付費(fèi)電視業(yè)務(wù)的基本功能,具備授權(quán)數(shù)字電視業(yè)務(wù)的接收、中文顯示、基本電子節(jié)目指南EPG(即節(jié)目預(yù)告)、軟件升級(jí)、加密信息提示、故障提示等功能。第二類稱為增...
一種非常簡(jiǎn)單的壓縮方法是行程長(zhǎng)度編碼,這種方法使用數(shù)據(jù)及數(shù)據(jù)長(zhǎng)度這樣簡(jiǎn)單的編碼代替同樣的連續(xù)數(shù)據(jù),這是無(wú)損數(shù)據(jù)壓縮的一個(gè)實(shí)例。這種方法經(jīng)常用于辦公計(jì)算機(jī)以更好地利用磁盤空間、或者更好地利用計(jì)算機(jī)網(wǎng)絡(luò)中的帶寬。對(duì)于電子表格、文本、可執(zhí)行文件等這樣的符號(hào)數(shù)據(jù)來(lái)說(shuō),無(wú)損是一個(gè)非常關(guān)鍵的要求,因?yàn)槌艘恍┯邢薜那闆r,大多數(shù)情況下即使是一個(gè)數(shù)據(jù)位的變化都是無(wú)法接受的。
對(duì)于視頻和音頻數(shù)據(jù),只要不損失數(shù)據(jù)的重要部分一定程度的質(zhì)量下降是可以接受的。通過(guò)利用人類感知系統(tǒng)的局限,能夠大幅度得節(jié)約存儲(chǔ)空間并且得到的結(jié)果質(zhì)量與原始數(shù)據(jù)質(zhì)量相比并沒(méi)有明顯的差別。這些有損數(shù)據(jù)壓縮方法通常需要在壓縮速度、壓縮數(shù)據(jù)大小以及質(zhì)量損失這三者之間進(jìn)行折衷。
有損圖像壓縮用于數(shù)碼相機(jī)中,大幅度地提高了存儲(chǔ)能力,同時(shí)圖像質(zhì)量幾乎沒(méi)有降低。用于DVD的有損MPEG-2編解碼視頻壓縮也實(shí)現(xiàn)了類似的功能。
在有損音頻壓縮中,心理聲學(xué)的方法用來(lái)去除信號(hào)中聽(tīng)不見(jiàn)或者很難聽(tīng)見(jiàn)的成分。人類語(yǔ)音的壓縮經(jīng)常使用更加專業(yè)的技術(shù),因此人們有時(shí)也將“語(yǔ)音壓縮”或者“語(yǔ)音編碼”作為一個(gè)獨(dú)立的研究領(lǐng)域與“音頻壓縮”區(qū)分開(kāi)來(lái)。不同的音頻和語(yǔ)音壓縮標(biāo)準(zhǔn)都屬于音頻編解碼范疇。例如語(yǔ)音壓縮用于因特網(wǎng)電話,而音頻壓縮被用于CD翻錄并且使用 MP3 播放器解碼。
壓縮的理論基礎(chǔ)是信息論(它與算法信息論密切相關(guān))以及率失真理論,這個(gè)領(lǐng)域的研究工作主要是由 Claude Shannon 奠定的,他在二十世紀(jì)四十年代末期及五十年代早期發(fā)表了這方面的基礎(chǔ)性的論文。Doyle 和 Carlson 在2000年寫道數(shù)據(jù)壓縮“有所有的工程領(lǐng)域最簡(jiǎn)單、最優(yōu)美的設(shè)計(jì)理論之一”。密碼學(xué)與編碼理論也是密切相關(guān)的學(xué)科,數(shù)據(jù)壓縮的思想與統(tǒng)計(jì)推斷也有很深的淵源。
許多無(wú)損數(shù)據(jù)壓縮系統(tǒng)都可以看作是四步模型,有損數(shù)據(jù)壓縮系統(tǒng)通常包含更多的步驟,例如它包括預(yù)測(cè)、頻率變換以及量化。
Lempel-Ziv(LZ)壓縮方法是最流行的無(wú)損存儲(chǔ)算法之一。DEFLATE是 LZ 的一個(gè)變體,它針對(duì)解壓速度與壓縮率進(jìn)行了優(yōu)化,雖然它的壓縮速度可能非常緩慢,PKZIP、gzip 以及 PNG 都在使用 DEFLATE。LZW (Lempel-Ziv-Welch)是 Unisys 的專利,直到2003年6月專利到期限,這種方法用于 GIF 圖像。另外值得一提的是 LZR (LZ-Renau) 方法,它是 Zip 方法的基礎(chǔ)。LZ 方法使用基于表格的壓縮模型,其中表格中的條目用重復(fù)的數(shù)據(jù)串替換。對(duì)于大多數(shù)的 LZ 方法來(lái)說(shuō),這個(gè)表格是從最初的輸入數(shù)據(jù)動(dòng)態(tài)生成的。這個(gè)表格經(jīng)常采用霍夫曼編碼維護(hù)(例如,SHRI、LZX)。 一個(gè)性能良好基于 LZ 的編碼機(jī)制是 LZX,它用于微軟公司的 CAB 格式。
最好的壓縮工具將概率模型預(yù)測(cè)結(jié)果用于算術(shù)編碼。算術(shù)編碼由 Jorma Rissanen 發(fā)明,并且由 Witten、Neal 以及 Cleary 將它轉(zhuǎn)變成一個(gè)實(shí)用的方法。這種方法能夠?qū)崿F(xiàn)比眾人皆知的哈夫曼算法更好的壓縮,并且它本身非常適合于自適應(yīng)數(shù)據(jù)壓縮,自適應(yīng)數(shù)據(jù)壓縮的預(yù)測(cè)與上下文密切相關(guān)。算術(shù)編碼已經(jīng)用于二值圖像壓縮標(biāo)準(zhǔn) JBIG、文檔壓縮標(biāo)準(zhǔn) DejaVu。文本 輸入 系統(tǒng) Dasher 是一個(gè)逆算術(shù)編碼器。
數(shù)據(jù)壓縮可分成兩種類型,一種叫做無(wú)損壓縮,另一種叫做有損壓縮。
無(wú)損壓縮是指使用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu)(或者叫做還原,解壓縮),重構(gòu)后的數(shù)據(jù)與原來(lái)的數(shù)據(jù)完全相同;無(wú)損壓縮用于要求重構(gòu)的信號(hào)與原始信號(hào)完全一致的場(chǎng)合。一個(gè)很常見(jiàn)的例子是磁盤文件的壓縮。無(wú)損壓縮算法一般可以把普通文件的數(shù)據(jù)壓縮到原來(lái)的1/2~1/4。一些常用的無(wú)損壓縮算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv & Welch)壓縮算法。
有損壓縮是指使用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu),重構(gòu)后的數(shù)據(jù)與原來(lái)的數(shù)據(jù)有所不同,但不影響人對(duì)原始資料表達(dá)的信息造成誤解。有損壓縮適用于重構(gòu)信號(hào)不一定非要和原始信號(hào)完全相同的場(chǎng)合。例如,圖像和聲音的壓縮就可以采用有損壓縮,因?yàn)槠渲邪臄?shù)據(jù)往往多于我們的視覺(jué)系統(tǒng)和聽(tīng)覺(jué)系統(tǒng)所能接收的信息,丟掉一些數(shù)據(jù)而不至于對(duì)聲音或者圖像所表達(dá)的意思產(chǎn)生誤解,但可大大提高壓縮比。
格式:pdf
大?。?span id="54q5t4t" class="single-tag-height">459KB
頁(yè)數(shù): 21頁(yè)
評(píng)分: 4.6
目 錄 實(shí)驗(yàn)一 用C/C++語(yǔ)言實(shí)現(xiàn)游程編碼 實(shí)驗(yàn)二 用C/C++語(yǔ)言實(shí)現(xiàn)算術(shù)編碼 實(shí)驗(yàn)三 用C/C++語(yǔ)言實(shí)現(xiàn) LZW編碼 實(shí)驗(yàn)四 用C/C++語(yǔ)言實(shí)現(xiàn) 2D-DCT變換 13 實(shí)驗(yàn)一 用C/C++語(yǔ)言實(shí)現(xiàn)游程編碼 1. 實(shí)驗(yàn)?zāi)康?1) 通過(guò)實(shí)驗(yàn)進(jìn)一步掌握游程編碼的原理; 2) 用C/C++語(yǔ)言實(shí)現(xiàn)游程編碼。 2. 實(shí)驗(yàn)要求 給出數(shù)字字符,能正確輸出編碼。 3. 實(shí)驗(yàn)內(nèi)容 現(xiàn)實(shí)中有許多這樣的圖像,在一幅圖像中具有許多顏色相同的圖 塊。在這些圖塊中,許多行上都具有相同的顏色,或者在一行上有許多 連續(xù)的象素都具有相同的顏色值。在這種情況下就不需要存儲(chǔ)每一個(gè)象 素的顏色值,而僅僅存儲(chǔ)一個(gè)象素的顏色值,以及具有相同顏色的象素 數(shù)目就可以,或者存儲(chǔ)一個(gè)象素的顏色值,以及具有相同顏色值的行 數(shù)。這種壓縮編碼稱為游程編碼,常用 (run length encoding ,RLE)表 示
格式:pdf
大?。?span id="pmyq0er" class="single-tag-height">459KB
頁(yè)數(shù): 未知
評(píng)分: 4.7
隨著科技發(fā)展對(duì)數(shù)據(jù)的要求越來(lái)越嚴(yán)格,本文特別針對(duì)遙測(cè)數(shù)據(jù)中的噪聲參數(shù)進(jìn)行研究,在深入了解信號(hào)特征的基礎(chǔ)上,結(jié)合當(dāng)今數(shù)據(jù)壓縮發(fā)展的前沿技術(shù),設(shè)計(jì)、改進(jìn)得到一種可應(yīng)用于實(shí)際情況、能夠滿足實(shí)際需求的噪聲數(shù)據(jù)壓縮算法,對(duì)該算法進(jìn)行各類條件下的仿真,并研制采用該算法的滿足高效、實(shí)時(shí)要求的原理樣機(jī)。
傳真機(jī)的數(shù)據(jù)壓縮系統(tǒng)大致有MH、MR、MMR和JBIG等幾種黑白文稿數(shù)據(jù)壓縮系統(tǒng),還有JPEG彩色文稿數(shù)據(jù)壓縮系統(tǒng)。傳真機(jī)所標(biāo)明支持的壓縮系統(tǒng)越多,其兼容性就越好。
一般現(xiàn)在的傳真機(jī)都支持MH、MR、MMR等壓縮系統(tǒng),而JBIG做為一種最新的高效率的壓縮技術(shù),還只是在中高檔的傳真機(jī)上應(yīng)用。彩色傳真機(jī)除了支持前幾種黑白壓縮技術(shù)外,還支持JPEG壓縮技術(shù)以適應(yīng)彩色文稿的傳真需要。 2100433B
傳真機(jī)為了實(shí)現(xiàn)傳輸高速化,就通過(guò)壓縮系統(tǒng)壓縮每幅圖像所產(chǎn)生的數(shù)據(jù),這就是數(shù)據(jù)壓縮系統(tǒng)。為壓縮每幅圖像的傳輸時(shí)間,在三類傳真機(jī)中,先是將模擬圖像信號(hào)經(jīng)模擬/數(shù)字變換成圖像數(shù)據(jù)信號(hào),之后用數(shù)據(jù)要做系統(tǒng)減少圖像數(shù)據(jù)的信息冗余度,使每幅圖像需傳送的數(shù)據(jù)大大減少;其次是減少占用話路的時(shí)間與傳真過(guò)程中的附屬時(shí)間,以提高操作的自動(dòng)化程度。
1、MH
2、MR
3、MMR
4、JBIG