中文名 | 數(shù)據(jù)壓縮 | 外文名 | Data Compression |
---|---|---|---|
包????括 | 有損壓縮和無損壓縮 | 功????能 | 壓縮 |
數(shù)據(jù)壓縮的方式非常多,不同特點的數(shù)據(jù)有不同的數(shù)據(jù)壓縮方式(也就是編碼方式),下面從幾個方面對其進行分類。
(1)即時壓縮和非即時壓縮
比如打IP電話,就是將語音信號轉(zhuǎn)化為數(shù)字信號,同時進行壓縮,然后通過Internet傳送出去,這個數(shù)據(jù)壓縮的過程是即時進行的。即時壓縮一般應用在影像、聲音數(shù)據(jù)的傳送中。即時壓縮常用到專門的硬件設(shè)備,如壓縮卡等。
非即時壓縮是計算機用戶經(jīng)常用到的,這種壓縮在需要的情況下才進行,沒有即時性。例如壓縮一張圖片、一篇文章、一段音樂等。非即時壓縮一般不需要專門的設(shè)備,直接在計算機中安裝并使用相應的壓縮軟件就可以了。
(2)數(shù)據(jù)壓縮和文件壓縮
其實數(shù)據(jù)壓縮包含了文件壓縮,數(shù)據(jù)本來是泛指任何數(shù)字化的信息,包括計算機中用到的各種文件,但有時,數(shù)據(jù)是專指一些具有時間性的數(shù)據(jù),這些數(shù)據(jù)常常是即時采集、即時處理或傳輸?shù)?。而文件壓縮就是專指對將要保存在磁盤等物理介質(zhì)的數(shù)據(jù)進行壓縮,如一篇文章數(shù)據(jù)、一段音樂數(shù)據(jù)、一段程序編碼數(shù)據(jù)等的壓縮。
(3)無損壓縮與有損壓縮
無損壓縮利用數(shù)據(jù)的統(tǒng)計冗余進行壓縮。數(shù)據(jù)統(tǒng)計冗余度的理論限制為2:1到5:1,所以無損壓縮的壓縮比一般比較低。這類方法廣泛應用于文本數(shù)據(jù)、程序和特殊應用場合的圖像數(shù)據(jù)等需要精確存儲數(shù)據(jù)的壓縮。有損壓縮方法利用了人類視覺、聽覺對圖像、聲音中的某些頻率成分不敏感的特性,允許壓縮的過程中損失一定的信息。雖然不能完全恢復原始數(shù)據(jù),但是所損失的部分對理解原始圖像的影響較小,卻換來了比較大的壓縮比。有損壓縮廣泛應用于語音、圖像和視頻數(shù)據(jù)的壓縮。
一種非常簡單的壓縮方法是行程長度編碼,這種方法使用數(shù)據(jù)及數(shù)據(jù)長度這樣簡單的編碼代替同樣的連續(xù)數(shù)據(jù),這是無損數(shù)據(jù)壓縮的一個實例。這種方法經(jīng)常用于辦公計算機以更好地利用磁盤空間、或者更好地利用計算機網(wǎng)絡(luò)中的帶寬。對于電子表格、文本、可執(zhí)行文件等這樣的符號數(shù)據(jù)來說,無損是一個非常關(guān)鍵的要求,因為除了一些有限的情況,大多數(shù)情況下即使是一個數(shù)據(jù)位的變化都是無法接受的。
對于視頻和音頻數(shù)據(jù),只要不損失數(shù)據(jù)的重要部分一定程度的質(zhì)量下降是可以接受的。通過利用人類感知系統(tǒng)的局限,能夠大幅度得節(jié)約存儲空間并且得到的結(jié)果質(zhì)量與原始數(shù)據(jù)質(zhì)量相比并沒有明顯的差別。這些有損數(shù)據(jù)壓縮方法通常需要在壓縮速度、壓縮數(shù)據(jù)大小以及質(zhì)量損失這三者之間進行折衷。
有損圖像壓縮用于數(shù)碼相機中,大幅度地提高了存儲能力,同時圖像質(zhì)量幾乎沒有降低。用于DVD的有損MPEG-2編解碼視頻壓縮也實現(xiàn)了類似的功能。
在有損音頻壓縮中,心理聲學的方法用來去除信號中聽不見或者很難聽見的成分。人類語音的壓縮經(jīng)常使用更加專業(yè)的技術(shù),因此人們有時也將“語音壓縮”或者“語音編碼”作為一個獨立的研究領(lǐng)域與“音頻壓縮”區(qū)分開來。不同的音頻和語音壓縮標準都屬于音頻編解碼范疇。例如語音壓縮用于因特網(wǎng)電話,而音頻壓縮被用于CD翻錄并且使用 MP3 播放器解碼。
事實上,多媒體信息存在許多數(shù)據(jù)冗余。例如,一幅圖像中的靜止建筑背景、藍天和綠地,其中許多像素是相同的如果逐點存儲,就會浪費許多空間,這稱為空間冗余。又如,在電視和動畫的相鄰序列中,只有運動物體有少許變化,僅存儲差異部分即可,這稱為時間冗余。此外還有結(jié)構(gòu)冗余、視覺冗余等,這就為數(shù)據(jù)壓縮提供了條件。
總之,壓縮的理論基礎(chǔ)是信息論。從信息的角度來看,壓縮就是去除掉信息中的冗余,即去除掉確定的或可推知的信息,而保留不確定的信息,也就是用一種更接近信息本質(zhì)的描述來代替原有的冗余的描述,這個本質(zhì)的東西就是信息量。
數(shù)據(jù)壓縮 在計算機科學和信息論中,數(shù)據(jù)壓縮或者源編碼是按照特定的編碼機制用比未經(jīng)編碼少的數(shù)據(jù)位元(或者其它信息相關(guān)的單位)表示信息的過程。例如,如果我們將“compression”編碼為“c...
次梁加筋的意思表示。
可以找回歷史工程!
對于任何形式的通信來說,只有當信息的發(fā)送方和接受方都能夠理解編碼機制的時候壓縮數(shù)據(jù)通信才能夠工作。例如,只有當接受方知道這篇文章需要用英語字符解釋的時候這篇文章才有意義。同樣,只有當接受方知道編碼方法的時候他才能夠理解壓縮數(shù)據(jù)。一些壓縮算法利用了這個特性,在壓縮過程中對數(shù)據(jù)進行加密,例如利用密碼加密,以保證只有得到授權(quán)的一方才能正確地得到數(shù)據(jù)。
數(shù)據(jù)壓縮能夠?qū)崿F(xiàn)是因為多數(shù)現(xiàn)實世界的數(shù)據(jù)都有統(tǒng)計冗余。例如,字母“e”在英語中比字母“z”更加常用,字母“q”后面是“z”的可能性非常小。無損壓縮算法通常利用了統(tǒng)計冗余,這樣就能更加簡練地、但仍然是完整地表示發(fā)送方的數(shù)據(jù)。
如果允許一定程度的保真度損失,那么還可以實現(xiàn)進一步的壓縮。例如,人們看圖畫或者電視畫面的時候可能并不會注意到一些細節(jié)并不完善。同樣,兩個音頻錄音采樣序列可能聽起來一樣,但實際上并不完全一樣。有損壓縮算法在帶來微小差別的情況下使用較少的位數(shù)表示圖像、視頻或者音頻。
由于可以幫助減少如硬盤空間與連接帶寬這樣的昂貴資源的消耗,所以壓縮非常重要,然而壓縮需要消耗信息處理資源,這也可能是費用昂貴的。所以數(shù)據(jù)壓縮機制的設(shè)計需要在壓縮能力、失真度、所需計算資源以及其它需要考慮的不同因素之間進行折衷。
一些機制是可逆的,這樣就可以恢復原始的數(shù)據(jù),這種機制稱為無損數(shù)據(jù)壓縮;另外一些機制為了實現(xiàn)更高的壓縮率允許一定程度的數(shù)據(jù)損失,這種機制稱為有損數(shù)據(jù)壓縮。
然而,經(jīng)常有一些文件不能被無損數(shù)據(jù)壓縮算法壓縮,實際上對于不含可以辨別樣式的數(shù)據(jù)任何壓縮算法都不能壓縮。試圖壓縮已經(jīng)經(jīng)過壓縮的數(shù)據(jù)通常得到的結(jié)果實際上是擴展數(shù)據(jù),試圖壓縮經(jīng)過加密的數(shù)據(jù)通常也會得到這種結(jié)果。
實際上,有損數(shù)據(jù)壓縮也會最終達到不能工作的地步。我們來舉一個極端的例子,壓縮算法每次去掉文件最后一個字節(jié),那么經(jīng)過這個算法不斷的壓縮直至文件變空,壓縮算法將不能繼續(xù)工作。
壓縮的理論基礎(chǔ)是信息論(它與算法信息論密切相關(guān))以及率失真理論,這個領(lǐng)域的研究工作主要是由 Claude Shannon 奠定的,他在二十世紀四十年代末期及五十年代早期發(fā)表了這方面的基礎(chǔ)性的論文。Doyle 和 Carlson 在2000年寫道數(shù)據(jù)壓縮“有所有的工程領(lǐng)域最簡單、最優(yōu)美的設(shè)計理論之一”。密碼學與編碼理論也是密切相關(guān)的學科,數(shù)據(jù)壓縮的思想與統(tǒng)計推斷也有很深的淵源。
許多無損數(shù)據(jù)壓縮系統(tǒng)都可以看作是四步模型,有損數(shù)據(jù)壓縮系統(tǒng)通常包含更多的步驟,例如它包括預測、頻率變換以及量化。
最好的壓縮工具將概率模型預測結(jié)果用于算術(shù)編碼。算術(shù)編碼由 Jorma Rissanen 發(fā)明,并且由 Witten、Neal 以及 Cleary 將它轉(zhuǎn)變成一個實用的方法。這種方法能夠?qū)崿F(xiàn)比眾人皆知的哈夫曼算法更好的壓縮,并且它本身非常適合于自適應數(shù)據(jù)壓縮,自適應數(shù)據(jù)壓縮的預測與上下文密切相關(guān)。算術(shù)編碼已經(jīng)用于二值圖像壓縮標準 JBIG、文檔壓縮標準 DejaVu。文本 輸入 系統(tǒng) Dasher 是一個逆算術(shù)編碼器。
Lempel-Ziv(LZ)壓縮方法是最流行的無損存儲算法之一。DEFLATE是 LZ 的一個變體,它針對解壓速度與壓縮率進行了優(yōu)化,雖然它的壓縮速度可能非常緩慢,PKZIP、gzip 以及 PNG 都在使用 DEFLATE。LZW (Lempel-Ziv-Welch)是 Unisys 的專利,直到2003年6月專利到期限,這種方法用于 GIF 圖像。另外值得一提的是 LZR (LZ-Renau) 方法,它是 Zip 方法的基礎(chǔ)。LZ 方法使用基于表格的壓縮模型,其中表格中的條目用重復的數(shù)據(jù)串替換。對于大多數(shù)的 LZ 方法來說,這個表格是從最初的輸入數(shù)據(jù)動態(tài)生成的。這個表格經(jīng)常采用霍夫曼編碼維護(例如,SHRI、LZX)。 一個性能良好基于 LZ 的編碼機制是 LZX,它用于微軟公司的 CAB 格式。
數(shù)據(jù)壓縮可分成兩種類型,一種叫做無損壓縮,另一種叫做有損壓縮。
無損壓縮是指使用壓縮后的數(shù)據(jù)進行重構(gòu)(或者叫做還原,解壓縮),重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同;無損壓縮用于要求重構(gòu)的信號與原始信號完全一致的場合。一個很常見的例子是磁盤文件的壓縮。無損壓縮算法一般可以把普通文件的數(shù)據(jù)壓縮到原來的1/2~1/4。一些常用的無損壓縮算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv & Welch)壓縮算法。
有損壓縮是指使用壓縮后的數(shù)據(jù)進行重構(gòu),重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)有所不同,但不影響人對原始資料表達的信息造成誤解。有損壓縮適用于重構(gòu)信號不一定非要和原始信號完全相同的場合。例如,圖像和聲音的壓縮就可以采用有損壓縮,因為其中包含的數(shù)據(jù)往往多于我們的視覺系統(tǒng)和聽覺系統(tǒng)所能接收的信息,丟掉一些數(shù)據(jù)而不至于對聲音或者圖像所表達的意思產(chǎn)生誤解,但可大大提高壓縮比。
格式:pdf
大?。?span id="c2ytewz" class="single-tag-height">459KB
頁數(shù): 21頁
評分: 4.6
目 錄 實驗一 用C/C++語言實現(xiàn)游程編碼 實驗二 用C/C++語言實現(xiàn)算術(shù)編碼 實驗三 用C/C++語言實現(xiàn) LZW編碼 實驗四 用C/C++語言實現(xiàn) 2D-DCT變換 13 實驗一 用C/C++語言實現(xiàn)游程編碼 1. 實驗目的 1) 通過實驗進一步掌握游程編碼的原理; 2) 用C/C++語言實現(xiàn)游程編碼。 2. 實驗要求 給出數(shù)字字符,能正確輸出編碼。 3. 實驗內(nèi)容 現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多顏色相同的圖 塊。在這些圖塊中,許多行上都具有相同的顏色,或者在一行上有許多 連續(xù)的象素都具有相同的顏色值。在這種情況下就不需要存儲每一個象 素的顏色值,而僅僅存儲一個象素的顏色值,以及具有相同顏色的象素 數(shù)目就可以,或者存儲一個象素的顏色值,以及具有相同顏色值的行 數(shù)。這種壓縮編碼稱為游程編碼,常用 (run length encoding ,RLE)表 示
格式:pdf
大?。?span id="0vbhu7y" class="single-tag-height">459KB
頁數(shù): 未知
評分: 4.7
隨著科技發(fā)展對數(shù)據(jù)的要求越來越嚴格,本文特別針對遙測數(shù)據(jù)中的噪聲參數(shù)進行研究,在深入了解信號特征的基礎(chǔ)上,結(jié)合當今數(shù)據(jù)壓縮發(fā)展的前沿技術(shù),設(shè)計、改進得到一種可應用于實際情況、能夠滿足實際需求的噪聲數(shù)據(jù)壓縮算法,對該算法進行各類條件下的仿真,并研制采用該算法的滿足高效、實時要求的原理樣機。
傳真機的數(shù)據(jù)壓縮系統(tǒng)大致有MH、MR、MMR和JBIG等幾種黑白文稿數(shù)據(jù)壓縮系統(tǒng),還有JPEG彩色文稿數(shù)據(jù)壓縮系統(tǒng)。傳真機所標明支持的壓縮系統(tǒng)越多,其兼容性就越好。
一般現(xiàn)在的傳真機都支持MH、MR、MMR等壓縮系統(tǒng),而JBIG做為一種最新的高效率的壓縮技術(shù),還只是在中高檔的傳真機上應用。彩色傳真機除了支持前幾種黑白壓縮技術(shù)外,還支持JPEG壓縮技術(shù)以適應彩色文稿的傳真需要。 2100433B
傳真機為了實現(xiàn)傳輸高速化,就通過壓縮系統(tǒng)壓縮每幅圖像所產(chǎn)生的數(shù)據(jù),這就是數(shù)據(jù)壓縮系統(tǒng)。為壓縮每幅圖像的傳輸時間,在三類傳真機中,先是將模擬圖像信號經(jīng)模擬/數(shù)字變換成圖像數(shù)據(jù)信號,之后用數(shù)據(jù)要做系統(tǒng)減少圖像數(shù)據(jù)的信息冗余度,使每幅圖像需傳送的數(shù)據(jù)大大減少;其次是減少占用話路的時間與傳真過程中的附屬時間,以提高操作的自動化程度。
1、MH
2、MR
3、MMR
4、JBIG