預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào)進(jìn)行,然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確,誤差就會(huì)很小。在同等精度要求的條件下,就可以用比較少的比特進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。
中文名稱 | 預(yù)測(cè)編碼 | 外文名稱 | Predictive coding |
---|---|---|---|
應(yīng)用學(xué)科 | 通信 | 詞????性 | 名詞 |
分????類 | 編碼 |
PCM的編碼原理比較直觀和簡(jiǎn)單,如(1)所示。它的輸入是模擬信號(hào),首先經(jīng)過(guò)時(shí)間采樣,然后對(duì)每一樣值都進(jìn)行量化,作為數(shù)字信號(hào)的輸出,即PCM樣本序列x(0),x(1),…,x(n)。圖中的“量化,編碼”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。
如果采用相等的量化間隔處理采樣得到的信號(hào)值,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱為線性量化,如(2)所示。量化后的樣本值Y和原始值X的差 E=Y-X 稱為量化誤差或量化噪聲。
非均勻量化
用均勻量化方法量化輸入信號(hào)時(shí),無(wú)論對(duì)大的輸入信號(hào)還是小的輸入信號(hào)一律都采用相同的量化間隔。為了適應(yīng)幅度大的輸入信號(hào),同時(shí)又要滿足精度要求,就需要增加量化間隔,這將導(dǎo)致增加樣本的位數(shù)。但是,有些信號(hào)(例如話音信號(hào)),大信號(hào)出現(xiàn)的機(jī)會(huì)并不多,增加的樣本位數(shù)就沒(méi)有充分利用。為了克服這個(gè)不足,就出現(xiàn)了非均勻量化的方法,這種方法也叫做非線性量化。
非線性量化的基本想法是,對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔,這樣就可以在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。量化數(shù)據(jù)還原時(shí),采用相同的規(guī)則。
在語(yǔ)音信號(hào)的非線性量化中,采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種稱為m律壓擴(kuò)(m-law companding)算法,另一種稱為A律(A-law)壓擴(kuò)算法。
1.m 律壓擴(kuò)
G.711標(biāo)準(zhǔn)建議的m律壓擴(kuò)主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子(歸一化)確定量化輸入和輸出的關(guān)系:
式中:x為輸入信號(hào)幅度,規(guī)格化成 -1≤< /SPAN> x≤ 1;
sgn(x)為x的極性,x<0時(shí)為-1,否則為1;
m為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間隔之比,取100≤ m≤ 500,多取 m =255。
由于m律壓擴(kuò)的輸入和輸出關(guān)系是對(duì)數(shù)關(guān)系,所以這種編碼又稱為對(duì)數(shù)PCM。具體計(jì)算時(shí),用m=255,可以把對(duì)數(shù)曲線變成8條折線以簡(jiǎn)化計(jì)算過(guò)程。
2.A律壓擴(kuò)
G.711標(biāo)準(zhǔn)建議的A律壓擴(kuò)主要用在中國(guó)大陸和歐洲等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:
0 ≤ | x| ≤ 1/A
1/A < |x| ≤ 1
式中:x為輸入信號(hào)幅度,規(guī)格化成 -1 ≤< /SPAN > x ≤ 1;
sgn(x)為x的極性,x<0時(shí)為-1,否則為1;
A為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間隔之比,通常取A=87.6。
A律壓擴(kuò)的前一部分是線性的,其余部分與m律壓擴(kuò)相同。A律壓擴(kuò)具有與m律壓擴(kuò)相同的基本性能(在大信號(hào)區(qū)信噪比高于m律量化器,但在小信號(hào)區(qū)不如m律量化器)和實(shí)現(xiàn)方面的優(yōu)點(diǎn),尤其是還可以用直線段很好地近似,以便于直接壓擴(kuò)或數(shù)字壓擴(kuò),并易于與線性編碼格式相互轉(zhuǎn)換。具體計(jì)算時(shí),A=87.56,為簡(jiǎn)化計(jì)算,同樣把對(duì)數(shù)曲線部分變成13條折線。
對(duì)于采樣頻率為8 kHz,樣本精度為13比特、14比特或者16比特的輸入信號(hào),使用m率壓擴(kuò)編碼或者使用A率壓擴(kuò)編碼,經(jīng)過(guò)PCM編碼器之后每個(gè)樣本的精度為8比特,輸出的數(shù)據(jù)率為64 kbps。這個(gè)數(shù)據(jù)就是CCITT推薦的G.711標(biāo)準(zhǔn):話音頻率脈沖編碼調(diào)制(Pulse Code Modulation (PCM) of Voice Frequencies)。通常的聽(tīng)覺(jué)主觀感覺(jué)認(rèn)為8位壓擴(kuò)量化有不低于12位均勻量化A/D的信噪比及動(dòng)態(tài)范圍。
自適應(yīng)量化
在一定量化級(jí)數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù),根據(jù)信號(hào)分布不均勻的特點(diǎn),希望系統(tǒng)具有隨輸入信號(hào)的變化區(qū)間足以保持輸入量化器的信號(hào)基本均勻的能力,這種能力叫自適應(yīng)量化。
自適應(yīng)量化必須有對(duì)輸入信號(hào)的幅值進(jìn)行估值的能力,有了估值才能確定相應(yīng)的改變量。若估值在信號(hào)的輸入端進(jìn)行,稱前饋?zhàn)赃m應(yīng);若在量化輸出端進(jìn)行,稱反饋?zhàn)赃m應(yīng)。信號(hào)的估值必須簡(jiǎn)單,占用時(shí)間短,才能達(dá)到實(shí)時(shí)處理的目的。
自適應(yīng)預(yù)測(cè)
預(yù)測(cè)參數(shù)的最佳化依賴信源的特征,要得到最佳預(yù)測(cè)參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測(cè)參數(shù)往往又得不到較好的性能。為了能使性能較佳,又不致于有太大的工作量,可以采用自適應(yīng)預(yù)測(cè)。
為了減少計(jì)算工作量,預(yù)測(cè)參數(shù)仍采用固定的,但此時(shí)有多組預(yù)測(cè)參數(shù)可供選擇,這些預(yù)測(cè)參數(shù)根據(jù)常見(jiàn)的信源特征求得。編碼時(shí)具體采用哪組預(yù)測(cè)參數(shù)需根據(jù)特征來(lái)自適應(yīng)地確定。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時(shí)自動(dòng)地選擇一組預(yù)測(cè)參數(shù),使該實(shí)際值與預(yù)測(cè)值的均方誤差最小。隨著編碼區(qū)間的不同,預(yù)測(cè)參數(shù)自適應(yīng)地變化,以達(dá)到準(zhǔn)最佳預(yù)測(cè)。
在圖像傳輸技術(shù)中,活動(dòng)圖像特別是電視圖像是關(guān)注的主要對(duì)象?;顒?dòng)圖像是由時(shí)間上以幀周期為間隔的連續(xù)圖像幀組成的時(shí)間圖像序列,它在時(shí)間上比在空間上具有更大的相關(guān)性。大多數(shù)電視圖像相鄰幀間細(xì)節(jié)變化是很小的,即視頻圖像幀間具有很強(qiáng)的相關(guān)性,利用幀所具有的相關(guān)性的特點(diǎn)進(jìn)行幀間編碼,可獲得比幀內(nèi)編碼高得多的壓縮比。對(duì)于靜止圖像或活動(dòng)很慢的圖像,可以少傳一些幀,如隔幀傳輸,未傳輸?shù)膸?,利用接收端的幀存?chǔ)器中前一幀的數(shù)據(jù)作為該幀數(shù)據(jù),對(duì)視覺(jué)沒(méi)有什么影響。因?yàn)槿搜蹖?duì)圖像中靜止或活動(dòng)慢的部分,要求有較高的空間分辨率,而對(duì)時(shí)間分辨率的要求可低些。這種方法叫幀重復(fù)方法,廣泛應(yīng)用于視頻電話、視頻會(huì)議系統(tǒng)中,其圖像幀速率一般為1~15幀/秒。
采用預(yù)測(cè)編碼的方法消除序列圖像在時(shí)間上的相關(guān)性,即不直接傳送當(dāng)前幀的像素值,而是傳送x和其前一幀或后一幀的對(duì)應(yīng)像素x' 之間的差值,這稱為幀間預(yù)測(cè)。當(dāng)圖像中存在著運(yùn)動(dòng)物體時(shí),簡(jiǎn)單的預(yù)測(cè)不能收到好的效果,例如當(dāng)前幀與前一幀的背景完全一樣,只是小球平移了一個(gè)位置,如果簡(jiǎn)單地以第k-1幀像素值作為k幀的預(yù)測(cè)值,則在實(shí)線和虛線所示的圓內(nèi)的預(yù)測(cè)誤差都不為零。如果已經(jīng)知道了小球運(yùn)動(dòng)的方向和速度,可以從小球在k-1幀的位置推算出它在k幀中的位置來(lái),而背景圖像(不考慮被遮擋的部分)仍以前一幀的背景代替,將這種考慮了小球位移的k-1幀圖像作為k幀的預(yù)測(cè)值,就比簡(jiǎn)單的預(yù)測(cè)準(zhǔn)確得多,從而可以達(dá)到更高的數(shù)據(jù)壓縮比。這種預(yù)測(cè)方法稱為具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)。
具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)編碼是視頻壓縮的關(guān)鍵技術(shù)之一,它包括以下幾個(gè)步驟:首先,將圖像分解成相對(duì)靜止的背景和若干運(yùn)動(dòng)的物體,各個(gè)物體可能有不同的位移,但構(gòu)成每個(gè)物體的所有像素的位移相同,通過(guò)運(yùn)動(dòng)估值得到每個(gè)物體的位移矢量;然后,利用位移矢量計(jì)算經(jīng)運(yùn)動(dòng)補(bǔ)償后的預(yù)測(cè)值;最后對(duì)預(yù)測(cè)誤差進(jìn)行量化、編碼、傳輸,同時(shí)將位移矢量和圖像分解方式等信息送到接收端。
在具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)編碼系統(tǒng)中,對(duì)圖像靜止區(qū)和不同運(yùn)動(dòng)區(qū)的實(shí)時(shí)完善分解和運(yùn)動(dòng)矢量計(jì)算是較為復(fù)雜和困難的。在實(shí)際實(shí)現(xiàn)時(shí)經(jīng)常采用的是像素遞歸法和塊匹配法兩種簡(jiǎn)化的辦法。
像素遞歸法的具體作法是,仍需通過(guò)某種較為簡(jiǎn)單的方法首先將圖像分割成運(yùn)動(dòng)區(qū)和靜止區(qū)。在靜止區(qū)內(nèi)像素的位移為零,不進(jìn)行遞歸運(yùn)算;對(duì)運(yùn)動(dòng)區(qū)內(nèi)的像素,利用該像素左邊或正上方像素的位移矢量D作為本像素的位移矢量,然后用前一幀對(duì)應(yīng)位置上經(jīng)位移D后的像素值作為當(dāng)前幀中該像素的預(yù)測(cè)值。如果預(yù)測(cè)誤差小于某一閾值,則認(rèn)為該像素可預(yù)測(cè),無(wú)需傳送信息;如果預(yù)測(cè)誤差大于該閾值,編碼器則需傳送量化后的預(yù)測(cè)誤差、以及該像素的地址,收、發(fā)雙方各自根據(jù)量化后的預(yù)測(cè)誤差更新位移矢量。由此可見(jiàn),像素遞歸法是對(duì)每一個(gè)像素根據(jù)預(yù)測(cè)誤差遞歸地給出一個(gè)估計(jì)的位移矢量,因而不需要單獨(dú)傳送位移矢量給接收端。
塊匹配法是另一種更為簡(jiǎn)單的運(yùn)動(dòng)估值方法。它將圖像劃分為許多子塊,并認(rèn)為子塊內(nèi)所有像素的位移量是相同的,這意味著將每個(gè)子塊視為一個(gè)“運(yùn)動(dòng)物體”。對(duì)于某一時(shí)間t,圖像幀中的某一子塊如果在另一時(shí)間t-t1的幀中可以找到若干與其十分相似的子塊,則稱其中最為相似的子塊為匹配塊,并認(rèn)為該匹配塊是時(shí)間t-t1的幀中相應(yīng)子塊位移的結(jié)果。位移矢量由兩幀中相應(yīng)子塊的坐標(biāo)決定。
考慮到一定時(shí)間間隔內(nèi)物體可能的運(yùn)動(dòng)速度、運(yùn)動(dòng)范圍和匹配搜索所需的計(jì)算量,在匹配搜索時(shí)一般僅在一個(gè)有限范圍內(nèi)進(jìn)行。假設(shè)在給定時(shí)間間隔內(nèi)最大可能的水平和垂直位移為d h和d v個(gè)像素,則搜索范圍SR為
其中M、N為子塊的水平和垂直像素?cái)?shù)。
在塊匹配方法中需要解決兩個(gè)問(wèn)題:一是確定判別兩個(gè)子塊匹配的準(zhǔn)則;二是尋找計(jì)算量最少的匹配搜索算法。判斷兩個(gè)子塊相似程度的準(zhǔn)則可以利用兩個(gè)塊間歸一化的二維互相關(guān)函數(shù)、兩子塊間亮度的均方差MSE或兩子塊間亮度差絕對(duì)值的均值MAD等。通過(guò)對(duì)不同判別準(zhǔn)則的比較研究表明,各種判別準(zhǔn)則對(duì)位移矢量的估值精度影響差別不是很大。由于MAD準(zhǔn)則的計(jì)算不含有乘法和除法運(yùn)算而成為最常使用的匹配判別準(zhǔn)則。MAD準(zhǔn)則定義如下:
其中Xk和Xk-1分別表示圖像在第k幀和第k-1幀的像素值。當(dāng)MAD最小時(shí),表示兩個(gè)子塊匹配。
對(duì)于匹配搜索算法,最簡(jiǎn)單和直接的方法就是全搜索方式,即將第k-1幀中的子塊在整個(gè)搜索區(qū)內(nèi)逐個(gè)像素移動(dòng),每移動(dòng)一次計(jì)算一次判決函數(shù)??偟囊苿?dòng)次數(shù)為 (2d h + 1)(2d v + 1)。當(dāng)d h = d v = 6時(shí),總的計(jì)算次數(shù)為169。顯然,全搜索的運(yùn)算量是相當(dāng)大的。為了加快搜索過(guò)程,人們提出了許多不同的搜索方法,其中應(yīng)用較廣的有二維對(duì)數(shù)法、三步法、共軛方向法和正交搜索法。這幾種方法都基于如下的假設(shè):當(dāng)偏離最小誤差方向時(shí),判決函數(shù)是單調(diào)上升的,搜索總沿著判決函數(shù)值減小的方向進(jìn)行。上述幾種方案所需的搜索步驟和計(jì)算點(diǎn)數(shù)略有差異,但基本思路是一致的。
通過(guò)上面介紹的兩種運(yùn)動(dòng)矢量估值方法可以看出,像素遞歸法對(duì)每一個(gè)像素給出一個(gè)估計(jì)的位移矢量,因而對(duì)較小面積物體的運(yùn)動(dòng)估值較為精確。但像素遞歸法在估值時(shí)需要進(jìn)行疊代運(yùn)算,從而存在著收斂速度和穩(wěn)定性問(wèn)題。塊匹配法對(duì)同一子塊內(nèi)位移量不同的像素只能給出同一個(gè)位移估值,限制了對(duì)每一像素的估值精度。但對(duì)于面積較大的運(yùn)動(dòng)物體而言,采用塊匹配法的預(yù)測(cè)要比采用像素遞歸法的預(yù)測(cè)效果好。另外,從軟硬件實(shí)現(xiàn)角度看,塊匹配算法相對(duì)簡(jiǎn)單,在實(shí)際活動(dòng)圖像壓縮編碼系統(tǒng)中得到較為普遍的應(yīng)用。
活動(dòng)圖像的幀間內(nèi)插編碼是在系統(tǒng)發(fā)送端每隔一段時(shí)間丟棄一幀或幾幀圖像,而在接收端再利用圖像的幀間相關(guān)性將丟棄的幀通過(guò)內(nèi)插恢復(fù)出來(lái),以防止幀率下降引起閃爍和動(dòng)作不連續(xù)?;謴?fù)丟棄幀的一個(gè)簡(jiǎn)單辦法是利用線性內(nèi)插,設(shè)x(i, j), y(i, j)分別代表兩個(gè)傳輸幀中相同空間位置上像素的亮度,在中間第n個(gè)內(nèi)插幀對(duì)應(yīng)位置的亮度z(i, j) 可用如下的內(nèi)插公式:
n=1,2,3,……N-1
其中N為兩個(gè)傳輸幀之間的幀間隔數(shù)。
簡(jiǎn)單線性幀間內(nèi)插的缺點(diǎn)在于當(dāng)圖像中有運(yùn)動(dòng)物體時(shí),兩個(gè)傳輸幀在物體經(jīng)過(guò)的區(qū)域上不再一一對(duì)應(yīng),因而引起圖像模糊。為解決這一問(wèn)題可采用帶有運(yùn)動(dòng)補(bǔ)償?shù)膸g內(nèi)插。具有運(yùn)動(dòng)補(bǔ)償?shù)膸g內(nèi)插和幀間預(yù)測(cè)都需要進(jìn)行運(yùn)動(dòng)估值,但二者的目的和運(yùn)動(dòng)估值不準(zhǔn)確所帶來(lái)的影響不完全相同。
在幀間預(yù)測(cè)中引入運(yùn)動(dòng)補(bǔ)償?shù)哪康氖菫榱藴p少預(yù)測(cè)誤差,從而提高編碼效率。運(yùn)動(dòng)估值的不準(zhǔn)確會(huì)使預(yù)測(cè)誤差加大,從而使傳輸?shù)臄?shù)據(jù)率上升,但接收端據(jù)此位移矢量和預(yù)測(cè)誤差解碼不會(huì)引起圖像質(zhì)量下降。而在幀間內(nèi)插中引入運(yùn)動(dòng)補(bǔ)償?shù)哪康?,是使恢?fù)的內(nèi)插幀中的運(yùn)動(dòng)物體不致因?yàn)閮?nèi)插而引起太大的圖像質(zhì)量下降。這是由于在丟棄幀內(nèi)沒(méi)有傳送任何信息,要確定運(yùn)動(dòng)物體在丟棄幀中的位置必須知道該物體的運(yùn)動(dòng)速度。運(yùn)動(dòng)估值的不準(zhǔn)確,將導(dǎo)致內(nèi)插出來(lái)的丟棄幀圖像的失真。另外,在幀間內(nèi)插中的位移估值一般要對(duì)運(yùn)動(dòng)區(qū)的每一個(gè)像素進(jìn)行,而不是對(duì)一個(gè)子塊;否則,內(nèi)插同樣會(huì)引起運(yùn)動(dòng)物體邊界的模糊。因此,在幀間內(nèi)插中較多使用能夠給出單個(gè)像素位移矢量的像素遞歸法。
其他還有閾值法(只傳送像素亮度的幀間差值超過(guò)一定閾值的像素)、幀內(nèi)插(對(duì)于活動(dòng)緩慢的圖像,利用前后兩幀圖像進(jìn)行內(nèi)插,得到預(yù)測(cè)圖像,然后對(duì)幀差信號(hào)進(jìn)行編碼)、運(yùn)動(dòng)估計(jì)與補(bǔ)償?shù)取?/p>
前面9位你對(duì)著清單附錄寫(xiě)就行,后面3位按流水號(hào)來(lái)。 比如下面這個(gè)圖,是平整場(chǎng)地的編碼咯,然后最后編寫(xiě)之后就是010101001001,前9位是清單附錄里的,照著寫(xiě),后三位是流水號(hào),假設(shè)你做的工程里有...
是否是查找西南11J812圖集,12頁(yè),1B項(xiàng)? 恩,是。就是這么查找的。
強(qiáng)制修改編碼
x^k = f(x'1,x'2,…, x' N,k), k > N (1)
式中k > N表示x'1,x'2,…, x' N的時(shí)序在xk之前,為所謂因果型(Causal)預(yù)測(cè),否則為非因果型預(yù)測(cè)。
接收端把接收到的量化后的預(yù)測(cè)誤差e^k 與本地算出的x^k相加,即得恢復(fù)信號(hào)x'k。如果沒(méi)有傳輸誤差,則接收端重建信號(hào)x'k與發(fā)送端原始信號(hào)xk之間的誤差為:
xk - x' k = x k - ( x^k + e^k )
= ( xk - x^k ) - e^k
= ek - e^k
= qk (2)
這正是發(fā)送端量化器產(chǎn)生的量化誤差,即整個(gè)預(yù)測(cè)編碼系統(tǒng)的失真完全由量化器產(chǎn)生。因此,當(dāng)xk已經(jīng)是數(shù)字信號(hào)時(shí),如果去掉量化器,使e^k = ek,則qk = 0,即x'k = xk 。這表明,這類不帶量化器的DPCM系統(tǒng)也可用于無(wú)損編碼。但如果量化誤差qk ≠ 0,則x'k ≠xk,為有損編碼。
如果預(yù)測(cè)方程式(2)的右方是各個(gè)x'i的線性函數(shù),即
N
x' k = Σai(k) x' i k > N (3)
i=1
即得常用的線性預(yù)測(cè),又稱線性預(yù)測(cè)編碼(LPC,Linear Predictive Coding)。LPC在語(yǔ)音處理中得到廣泛應(yīng)用,并在此基礎(chǔ)上發(fā)展了許多算法,典型的有:多脈沖線性預(yù)測(cè)編碼(MPLPC),規(guī)則脈沖激勵(lì)編碼(RPE),碼激勵(lì)線性預(yù)測(cè)(CELP),代數(shù)激勵(lì)線性預(yù)測(cè)(ACELP),矢量和激勵(lì)線性預(yù)測(cè)(VSELP),QCELP(Qualcomm CELP,變速率CELP),低延時(shí)碼激勵(lì)線性預(yù)測(cè)(LD-CELP),共軛結(jié)構(gòu)代數(shù)激勵(lì)線性預(yù)測(cè)(CS-ACELP),混合激勵(lì)線性預(yù)測(cè)(MELP),間隔同步更新碼激勵(lì)線性預(yù)測(cè)(PSI-CELP),松弛碼激勵(lì)線性預(yù)測(cè)(RCELP),殘差激勵(lì)線性預(yù)測(cè)(RELP),規(guī)則脈沖激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)(RPE-LTP)等。
在DPCM中,“1位量化”的特殊情況稱為增量調(diào)制(Δ調(diào)制)。
為了能夠正確恢復(fù)被壓縮的信號(hào),不僅在接收端有一個(gè)與發(fā)送端相同的預(yù)測(cè)器,而且其輸入信號(hào)也要相同(都是x'k,而不是xk),動(dòng)作也與發(fā)送端的預(yù)測(cè)器環(huán)路(即發(fā)送端本地的反量化和解碼部分)完全相同。
在圖像信號(hào)中應(yīng)用DPCM時(shí),用作預(yù)測(cè)的像素和被預(yù)測(cè)的像素可以在同一行,也可以在不同行(同一幀),甚至在不同幀,分別稱為一維預(yù)測(cè)、二維預(yù)測(cè)和三維預(yù)測(cè)。聲音信號(hào)中的預(yù)測(cè)只是一維預(yù)測(cè)。
DPCM的優(yōu)點(diǎn)是算法簡(jiǎn)單,容易硬件實(shí)現(xiàn),缺點(diǎn)是對(duì)信道噪聲很敏感,會(huì)產(chǎn)生誤差擴(kuò)散。即某一位碼出錯(cuò),對(duì)圖像一維預(yù)測(cè)來(lái)說(shuō),將使該像素以后的同一行各個(gè)像素都產(chǎn)生誤差;而對(duì)二維預(yù)測(cè),該碼引起的誤差還將擴(kuò)散到以下的各行。這樣,將使圖像質(zhì)量大大下降。同時(shí),DPCM的壓縮率也比較低。隨著變換編碼的廣泛應(yīng)用,DPCM的作用已很有限。
格式:pdf
大?。?span id="usc2kcc" class="single-tag-height">278KB
頁(yè)數(shù): 未知
評(píng)分: 4.6
根據(jù)AVS標(biāo)準(zhǔn)中幀內(nèi)預(yù)測(cè)算法的特點(diǎn),提出了一種應(yīng)用于AVS高清實(shí)時(shí)編碼器的幀內(nèi)預(yù)測(cè)硬件設(shè)計(jì)方案。該設(shè)計(jì)中將亮度和色度預(yù)測(cè)共用一個(gè)預(yù)測(cè)單元,采用6路數(shù)據(jù)并行流水處理的結(jié)構(gòu),提高了處理速度。同時(shí)在分析AVS幀內(nèi)預(yù)測(cè)各模式算法的基礎(chǔ)上,結(jié)合移位寄存器操作實(shí)現(xiàn)各模式運(yùn)算單元的進(jìn)一步資源共享,簡(jiǎn)化了參考數(shù)據(jù)選擇機(jī)制,減少資源消耗。實(shí)驗(yàn)結(jié)果表明,該設(shè)計(jì)完全能夠滿足高清視頻圖像(1 920×1 080,30 f/s(幀/秒))實(shí)時(shí)編碼要求。
格式:pdf
大?。?span id="g02qi0w" class="single-tag-height">278KB
頁(yè)數(shù): 2頁(yè)
評(píng)分: 4.7
序號(hào) 物料編碼 型號(hào)規(guī)格 1 3225040084179578 熒光管 /歐司朗DULUXSTAR CL/7W 2 3225080084179570 金屬鹵化物燈 /歐司朗HQI-E/涂粉70W 3 3225040082797872 熒光管 /OSRAM DULUXSTAR/TWIST 23W 4 3225040084513150 熒光管 /歐司朗YZ15T8 15W 5 3225040084179582 熒光管 /歐司朗 電子節(jié)能燈 DULUXSTAR 32W 6 3225990084534074 節(jié)能燈 /歐司朗 24W 7 3213100084566170 日光燈具 歐司朗LMY-36W 8 3213100084179573 日光燈具 歐司朗LMY-2*36W 9 3229990083704157 應(yīng)急日光燈具 歐司朗LMYyj-1*36W 10 3213100084566
線性預(yù)測(cè)編碼的基礎(chǔ)是假設(shè)聲音信號(hào)(濁音)是音管末端的蜂鳴器產(chǎn)生的,偶爾伴隨有嘶嘶聲與爆破聲(齒擦音與爆破音)。盡管這看起來(lái)有些原始,但是這種模式實(shí)際上非常接近于真實(shí)語(yǔ)音產(chǎn)生過(guò)程。聲帶之間的聲門(mén)產(chǎn)生不同強(qiáng)度(音量)與頻率(音調(diào))的聲音,喉嚨與嘴組成共鳴聲道。嘶嘶聲與爆破聲通過(guò)舌頭、嘴唇以及喉嚨的作用產(chǎn)生出來(lái)。
線性預(yù)測(cè)編碼通過(guò)估計(jì)共振峰、剔除它們?cè)谡Z(yǔ)音信號(hào)中的作用、估計(jì)保留的蜂鳴音強(qiáng)度與頻率來(lái)分析語(yǔ)音信號(hào)。剔除共振峰的過(guò)程稱為逆濾波,經(jīng)過(guò)這個(gè)過(guò)程剩余的信號(hào)稱為殘余信號(hào)(en:residue)。
描述峰鳴強(qiáng)度與頻率、共鳴峰、殘余信號(hào)的數(shù)字可以保存、發(fā)送到其它地方。線性預(yù)測(cè)編碼通過(guò)逆向的過(guò)程合成語(yǔ)音信號(hào):使用蜂鳴參數(shù)與殘余信號(hào)生成源信號(hào)、使用共振峰生成表示聲道的濾波器,源信號(hào)經(jīng)過(guò)濾波器的處理就得到語(yǔ)音信號(hào)。
由于語(yǔ)音信號(hào)隨著時(shí)間變化,這個(gè)過(guò)程是在一段段的語(yǔ)音信號(hào)幀上進(jìn)行處理的。通常每秒 30 到 50 幀的速度就能對(duì)可理解的信號(hào)進(jìn)行很好的壓縮。
根據(jù)斯坦福大學(xué) Robert M. Gray 的說(shuō)法,線性預(yù)測(cè)編碼起源于 1966 年,當(dāng)時(shí) NTT 的 S. Saito 和 F. Itakura 描述了一種自動(dòng)音素識(shí)別的方法,這種方法第一次使用了針對(duì)語(yǔ)音編碼的最大似然估計(jì)實(shí)現(xiàn)。1967 年,John Burg 略述了最大熵的實(shí)現(xiàn)方法。1969 年 Itakura 與 Saito 提出了部分相關(guān)(en:partial correlation)的概念, May Glen Culler 提議進(jìn)行實(shí)時(shí)語(yǔ)音壓縮,B. S. Atal 在美國(guó)聲學(xué)協(xié)會(huì)年會(huì)上展示了一個(gè) LPC 語(yǔ)音編碼器。1971 年 Philco-Ford 展示了使用 16 位 LPC 硬件的實(shí)時(shí) LPC 并且賣出了四個(gè)。
1972 年 ARPA 的 Bob Kahn 與 Jim Forgie (en:Lincoln Laboratory, LL) 以及 Dave Walden (BBN Technologies) 開(kāi)始了語(yǔ)音信息包的第一次開(kāi)發(fā),這最終帶來(lái)了 Voice over IP 技術(shù)。根據(jù) Lincoln Laboratory 的非正式歷史資料記載,1973 年 Ed Hofstetter 實(shí)現(xiàn)了第一個(gè) 2400 位/秒 的實(shí)時(shí) LPC。1974 年,第一個(gè)雙向?qū)崟r(shí) LPC 語(yǔ)音包通信在 Culler-Harrison 與 Lincoln Laboratories 之間通過(guò) ARPANET 以 3500 位/秒 的速度實(shí)現(xiàn)。1976 年,第一次 LPC 會(huì)議通過(guò) ARPANET 使用 Network Voice Protocol 在Culler-Harrison、ISI、SRI 與 LL 之間以 3500 位/秒 的速度實(shí)現(xiàn)。最后在 1978 年,BBN 的 Vishwanath et al. 開(kāi)發(fā)了第一個(gè)變速 LPC 算法。
線性預(yù)測(cè)編碼的基礎(chǔ)是假設(shè)聲音信號(hào)(濁音)是音管末端的蜂鳴器產(chǎn)生的,偶爾伴隨有嘶嘶聲與爆破聲(齒擦音與爆破音)。盡管這看起來(lái)有些原始,但是這種模式實(shí)際上非常接近于真實(shí)語(yǔ)音產(chǎn)生過(guò)程。聲帶之間的聲門(mén)產(chǎn)生不同強(qiáng)度(音量)與頻率(音調(diào))的聲音,喉嚨與嘴組成共鳴聲道。嘶嘶聲與爆破聲通過(guò)舌頭、嘴唇以及喉嚨的作用產(chǎn)生出來(lái)。
線性預(yù)測(cè)編碼通過(guò)估計(jì)共振峰、剔除它們?cè)谡Z(yǔ)音信號(hào)中的作用、估計(jì)保留的蜂鳴音強(qiáng)度與頻率來(lái)分析語(yǔ)音信號(hào)。剔除共振峰的過(guò)程稱為逆濾波,經(jīng)過(guò)這個(gè)過(guò)程剩余的信號(hào)稱為殘余信號(hào)(en:residue)。
描述峰鳴強(qiáng)度與頻率、共鳴峰、殘余信號(hào)的數(shù)字可以保存、發(fā)送到其它地方。線性預(yù)測(cè)編碼通過(guò)逆向的過(guò)程合成語(yǔ)音信號(hào):使用蜂鳴參數(shù)與殘余信號(hào)生成源信號(hào)、使用共振峰生成表示聲道的濾波器,源信號(hào)經(jīng)過(guò)濾波器的處理就得到語(yǔ)音信號(hào)。
由于語(yǔ)音信號(hào)隨著時(shí)間變化,這個(gè)過(guò)程是在一段段的語(yǔ)音信號(hào)幀上進(jìn)行處理的。通常每秒 30 到 50 幀的速度就能對(duì)可理解的信號(hào)進(jìn)行很好的壓縮。