自適應(yīng)量化
在一定量化級數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù),根據(jù)信號分布不均勻的特點(diǎn),希望系統(tǒng)具有隨輸入信號的變化區(qū)間足以保持輸入量化器的信號基本均勻的能力,這種能力叫自適應(yīng)量化。
自適應(yīng)量化必須有對輸入信號的幅值進(jìn)行估值的能力,有了估值才能確定相應(yīng)的改變量。若估值在信號的輸入端進(jìn)行,稱前饋?zhàn)赃m應(yīng);若在量化輸出端進(jìn)行,稱反饋?zhàn)赃m應(yīng)。信號的估值必須簡單,占用時(shí)間短,才能達(dá)到實(shí)時(shí)處理的目的。
自適應(yīng)預(yù)測
預(yù)測參數(shù)的最佳化依賴信源的特征,要得到最佳預(yù)測參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測參數(shù)往往又得不到較好的性能。為了能使性能較佳,又不致于有太大的工作量,可以采用自適應(yīng)預(yù)測。
為了減少計(jì)算工作量,預(yù)測參數(shù)仍采用固定的,但此時(shí)有多組預(yù)測參數(shù)可供選擇,這些預(yù)測參數(shù)根據(jù)常見的信源特征求得。編碼時(shí)具體采用哪組預(yù)測參數(shù)需根據(jù)特征來自適應(yīng)地確定。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時(shí)自動地選擇一組預(yù)測參數(shù),使該實(shí)際值與預(yù)測值的均方誤差最小。隨著編碼區(qū)間的不同,預(yù)測參數(shù)自適應(yīng)地變化,以達(dá)到準(zhǔn)最佳預(yù)測。
在圖像傳輸技術(shù)中,活動圖像特別是電視圖像是關(guān)注的主要對象?;顒訄D像是由時(shí)間上以幀周期為間隔的連續(xù)圖像幀組成的時(shí)間圖像序列,它在時(shí)間上比在空間上具有更大的相關(guān)性。大多數(shù)電視圖像相鄰幀間細(xì)節(jié)變化是很小的,即視頻圖像幀間具有很強(qiáng)的相關(guān)性,利用幀所具有的相關(guān)性的特點(diǎn)進(jìn)行幀間編碼,可獲得比幀內(nèi)編碼高得多的壓縮比。對于靜止圖像或活動很慢的圖像,可以少傳一些幀,如隔幀傳輸,未傳輸?shù)膸?,利用接收端的幀存儲器中前一幀的?shù)據(jù)作為該幀數(shù)據(jù),對視覺沒有什么影響。因?yàn)槿搜蹖D像中靜止或活動慢的部分,要求有較高的空間分辨率,而對時(shí)間分辨率的要求可低些。這種方法叫幀重復(fù)方法,廣泛應(yīng)用于視頻電話、視頻會議系統(tǒng)中,其圖像幀速率一般為1~15幀/秒。
采用預(yù)測編碼的方法消除序列圖像在時(shí)間上的相關(guān)性,即不直接傳送當(dāng)前幀的像素值,而是傳送x和其前一幀或后一幀的對應(yīng)像素x' 之間的差值,這稱為幀間預(yù)測。當(dāng)圖像中存在著運(yùn)動物體時(shí),簡單的預(yù)測不能收到好的效果,例如當(dāng)前幀與前一幀的背景完全一樣,只是小球平移了一個(gè)位置,如果簡單地以第k-1幀像素值作為k幀的預(yù)測值,則在實(shí)線和虛線所示的圓內(nèi)的預(yù)測誤差都不為零。如果已經(jīng)知道了小球運(yùn)動的方向和速度,可以從小球在k-1幀的位置推算出它在k幀中的位置來,而背景圖像(不考慮被遮擋的部分)仍以前一幀的背景代替,將這種考慮了小球位移的k-1幀圖像作為k幀的預(yù)測值,就比簡單的預(yù)測準(zhǔn)確得多,從而可以達(dá)到更高的數(shù)據(jù)壓縮比。這種預(yù)測方法稱為具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測。
具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測編碼是視頻壓縮的關(guān)鍵技術(shù)之一,它包括以下幾個(gè)步驟:首先,將圖像分解成相對靜止的背景和若干運(yùn)動的物體,各個(gè)物體可能有不同的位移,但構(gòu)成每個(gè)物體的所有像素的位移相同,通過運(yùn)動估值得到每個(gè)物體的位移矢量;然后,利用位移矢量計(jì)算經(jīng)運(yùn)動補(bǔ)償后的預(yù)測值;最后對預(yù)測誤差進(jìn)行量化、編碼、傳輸,同時(shí)將位移矢量和圖像分解方式等信息送到接收端。
在具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測編碼系統(tǒng)中,對圖像靜止區(qū)和不同運(yùn)動區(qū)的實(shí)時(shí)完善分解和運(yùn)動矢量計(jì)算是較為復(fù)雜和困難的。在實(shí)際實(shí)現(xiàn)時(shí)經(jīng)常采用的是像素遞歸法和塊匹配法兩種簡化的辦法。
像素遞歸法的具體作法是,仍需通過某種較為簡單的方法首先將圖像分割成運(yùn)動區(qū)和靜止區(qū)。在靜止區(qū)內(nèi)像素的位移為零,不進(jìn)行遞歸運(yùn)算;對運(yùn)動區(qū)內(nèi)的像素,利用該像素左邊或正上方像素的位移矢量D作為本像素的位移矢量,然后用前一幀對應(yīng)位置上經(jīng)位移D后的像素值作為當(dāng)前幀中該像素的預(yù)測值。如果預(yù)測誤差小于某一閾值,則認(rèn)為該像素可預(yù)測,無需傳送信息;如果預(yù)測誤差大于該閾值,編碼器則需傳送量化后的預(yù)測誤差、以及該像素的地址,收、發(fā)雙方各自根據(jù)量化后的預(yù)測誤差更新位移矢量。由此可見,像素遞歸法是對每一個(gè)像素根據(jù)預(yù)測誤差遞歸地給出一個(gè)估計(jì)的位移矢量,因而不需要單獨(dú)傳送位移矢量給接收端。
塊匹配法是另一種更為簡單的運(yùn)動估值方法。它將圖像劃分為許多子塊,并認(rèn)為子塊內(nèi)所有像素的位移量是相同的,這意味著將每個(gè)子塊視為一個(gè)“運(yùn)動物體”。對于某一時(shí)間t,圖像幀中的某一子塊如果在另一時(shí)間t-t1的幀中可以找到若干與其十分相似的子塊,則稱其中最為相似的子塊為匹配塊,并認(rèn)為該匹配塊是時(shí)間t-t1的幀中相應(yīng)子塊位移的結(jié)果。位移矢量由兩幀中相應(yīng)子塊的坐標(biāo)決定。
考慮到一定時(shí)間間隔內(nèi)物體可能的運(yùn)動速度、運(yùn)動范圍和匹配搜索所需的計(jì)算量,在匹配搜索時(shí)一般僅在一個(gè)有限范圍內(nèi)進(jìn)行。假設(shè)在給定時(shí)間間隔內(nèi)最大可能的水平和垂直位移為d h和d v個(gè)像素,則搜索范圍SR為
其中M、N為子塊的水平和垂直像素?cái)?shù)。
在塊匹配方法中需要解決兩個(gè)問題:一是確定判別兩個(gè)子塊匹配的準(zhǔn)則;二是尋找計(jì)算量最少的匹配搜索算法。判斷兩個(gè)子塊相似程度的準(zhǔn)則可以利用兩個(gè)塊間歸一化的二維互相關(guān)函數(shù)、兩子塊間亮度的均方差MSE或兩子塊間亮度差絕對值的均值MAD等。通過對不同判別準(zhǔn)則的比較研究表明,各種判別準(zhǔn)則對位移矢量的估值精度影響差別不是很大。由于MAD準(zhǔn)則的計(jì)算不含有乘法和除法運(yùn)算而成為最常使用的匹配判別準(zhǔn)則。MAD準(zhǔn)則定義如下:
其中Xk和Xk-1分別表示圖像在第k幀和第k-1幀的像素值。當(dāng)MAD最小時(shí),表示兩個(gè)子塊匹配。
對于匹配搜索算法,最簡單和直接的方法就是全搜索方式,即將第k-1幀中的子塊在整個(gè)搜索區(qū)內(nèi)逐個(gè)像素移動,每移動一次計(jì)算一次判決函數(shù)??偟囊苿哟螖?shù)為 (2d h + 1)(2d v + 1)。當(dāng)d h = d v = 6時(shí),總的計(jì)算次數(shù)為169。顯然,全搜索的運(yùn)算量是相當(dāng)大的。為了加快搜索過程,人們提出了許多不同的搜索方法,其中應(yīng)用較廣的有二維對數(shù)法、三步法、共軛方向法和正交搜索法。這幾種方法都基于如下的假設(shè):當(dāng)偏離最小誤差方向時(shí),判決函數(shù)是單調(diào)上升的,搜索總沿著判決函數(shù)值減小的方向進(jìn)行。上述幾種方案所需的搜索步驟和計(jì)算點(diǎn)數(shù)略有差異,但基本思路是一致的。
通過上面介紹的兩種運(yùn)動矢量估值方法可以看出,像素遞歸法對每一個(gè)像素給出一個(gè)估計(jì)的位移矢量,因而對較小面積物體的運(yùn)動估值較為精確。但像素遞歸法在估值時(shí)需要進(jìn)行疊代運(yùn)算,從而存在著收斂速度和穩(wěn)定性問題。塊匹配法對同一子塊內(nèi)位移量不同的像素只能給出同一個(gè)位移估值,限制了對每一像素的估值精度。但對于面積較大的運(yùn)動物體而言,采用塊匹配法的預(yù)測要比采用像素遞歸法的預(yù)測效果好。另外,從軟硬件實(shí)現(xiàn)角度看,塊匹配算法相對簡單,在實(shí)際活動圖像壓縮編碼系統(tǒng)中得到較為普遍的應(yīng)用。
活動圖像的幀間內(nèi)插編碼是在系統(tǒng)發(fā)送端每隔一段時(shí)間丟棄一幀或幾幀圖像,而在接收端再利用圖像的幀間相關(guān)性將丟棄的幀通過內(nèi)插恢復(fù)出來,以防止幀率下降引起閃爍和動作不連續(xù)?;謴?fù)丟棄幀的一個(gè)簡單辦法是利用線性內(nèi)插,設(shè)x(i, j), y(i, j)分別代表兩個(gè)傳輸幀中相同空間位置上像素的亮度,在中間第n個(gè)內(nèi)插幀對應(yīng)位置的亮度z(i, j) 可用如下的內(nèi)插公式:
n=1,2,3,……N-1
其中N為兩個(gè)傳輸幀之間的幀間隔數(shù)。
簡單線性幀間內(nèi)插的缺點(diǎn)在于當(dāng)圖像中有運(yùn)動物體時(shí),兩個(gè)傳輸幀在物體經(jīng)過的區(qū)域上不再一一對應(yīng),因而引起圖像模糊。為解決這一問題可采用帶有運(yùn)動補(bǔ)償?shù)膸g內(nèi)插。具有運(yùn)動補(bǔ)償?shù)膸g內(nèi)插和幀間預(yù)測都需要進(jìn)行運(yùn)動估值,但二者的目的和運(yùn)動估值不準(zhǔn)確所帶來的影響不完全相同。
在幀間預(yù)測中引入運(yùn)動補(bǔ)償?shù)哪康氖菫榱藴p少預(yù)測誤差,從而提高編碼效率。運(yùn)動估值的不準(zhǔn)確會使預(yù)測誤差加大,從而使傳輸?shù)臄?shù)據(jù)率上升,但接收端據(jù)此位移矢量和預(yù)測誤差解碼不會引起圖像質(zhì)量下降。而在幀間內(nèi)插中引入運(yùn)動補(bǔ)償?shù)哪康?,是使恢?fù)的內(nèi)插幀中的運(yùn)動物體不致因?yàn)閮?nèi)插而引起太大的圖像質(zhì)量下降。這是由于在丟棄幀內(nèi)沒有傳送任何信息,要確定運(yùn)動物體在丟棄幀中的位置必須知道該物體的運(yùn)動速度。運(yùn)動估值的不準(zhǔn)確,將導(dǎo)致內(nèi)插出來的丟棄幀圖像的失真。另外,在幀間內(nèi)插中的位移估值一般要對運(yùn)動區(qū)的每一個(gè)像素進(jìn)行,而不是對一個(gè)子塊;否則,內(nèi)插同樣會引起運(yùn)動物體邊界的模糊。因此,在幀間內(nèi)插中較多使用能夠給出單個(gè)像素位移矢量的像素遞歸法。
其他還有閾值法(只傳送像素亮度的幀間差值超過一定閾值的像素)、幀內(nèi)插(對于活動緩慢的圖像,利用前后兩幀圖像進(jìn)行內(nèi)插,得到預(yù)測圖像,然后對幀差信號進(jìn)行編碼)、運(yùn)動估計(jì)與補(bǔ)償?shù)取?/p>
x^k = f(x'1,x'2,…, x' N,k), k > N (1)
式中k > N表示x'1,x'2,…, x' N的時(shí)序在xk之前,為所謂因果型(Causal)預(yù)測,否則為非因果型預(yù)測。
接收端把接收到的量化后的預(yù)測誤差e^k 與本地算出的x^k相加,即得恢復(fù)信號x'k。如果沒有傳輸誤差,則接收端重建信號x'k與發(fā)送端原始信號xk之間的誤差為:
xk - x' k = x k - ( x^k + e^k )
= ( xk - x^k ) - e^k
= ek - e^k
= qk (2)
這正是發(fā)送端量化器產(chǎn)生的量化誤差,即整個(gè)預(yù)測編碼系統(tǒng)的失真完全由量化器產(chǎn)生。因此,當(dāng)xk已經(jīng)是數(shù)字信號時(shí),如果去掉量化器,使e^k = ek,則qk = 0,即x'k = xk 。這表明,這類不帶量化器的DPCM系統(tǒng)也可用于無損編碼。但如果量化誤差qk ≠ 0,則x'k ≠xk,為有損編碼。
如果預(yù)測方程式(2)的右方是各個(gè)x'i的線性函數(shù),即
N
x' k = Σai(k) x' i k > N (3)
i=1
即得常用的線性預(yù)測,又稱線性預(yù)測編碼(LPC,Linear Predictive Coding)。LPC在語音處理中得到廣泛應(yīng)用,并在此基礎(chǔ)上發(fā)展了許多算法,典型的有:多脈沖線性預(yù)測編碼(MPLPC),規(guī)則脈沖激勵(lì)編碼(RPE),碼激勵(lì)線性預(yù)測(CELP),代數(shù)激勵(lì)線性預(yù)測(ACELP),矢量和激勵(lì)線性預(yù)測(VSELP),QCELP(Qualcomm CELP,變速率CELP),低延時(shí)碼激勵(lì)線性預(yù)測(LD-CELP),共軛結(jié)構(gòu)代數(shù)激勵(lì)線性預(yù)測(CS-ACELP),混合激勵(lì)線性預(yù)測(MELP),間隔同步更新碼激勵(lì)線性預(yù)測(PSI-CELP),松弛碼激勵(lì)線性預(yù)測(RCELP),殘差激勵(lì)線性預(yù)測(RELP),規(guī)則脈沖激勵(lì)長時(shí)預(yù)測(RPE-LTP)等。
在DPCM中,“1位量化”的特殊情況稱為增量調(diào)制(Δ調(diào)制)。
為了能夠正確恢復(fù)被壓縮的信號,不僅在接收端有一個(gè)與發(fā)送端相同的預(yù)測器,而且其輸入信號也要相同(都是x'k,而不是xk),動作也與發(fā)送端的預(yù)測器環(huán)路(即發(fā)送端本地的反量化和解碼部分)完全相同。
在圖像信號中應(yīng)用DPCM時(shí),用作預(yù)測的像素和被預(yù)測的像素可以在同一行,也可以在不同行(同一幀),甚至在不同幀,分別稱為一維預(yù)測、二維預(yù)測和三維預(yù)測。聲音信號中的預(yù)測只是一維預(yù)測。
DPCM的優(yōu)點(diǎn)是算法簡單,容易硬件實(shí)現(xiàn),缺點(diǎn)是對信道噪聲很敏感,會產(chǎn)生誤差擴(kuò)散。即某一位碼出錯(cuò),對圖像一維預(yù)測來說,將使該像素以后的同一行各個(gè)像素都產(chǎn)生誤差;而對二維預(yù)測,該碼引起的誤差還將擴(kuò)散到以下的各行。這樣,將使圖像質(zhì)量大大下降。同時(shí),DPCM的壓縮率也比較低。隨著變換編碼的廣泛應(yīng)用,DPCM的作用已很有限。
PCM的編碼原理比較直觀和簡單,如(1)所示。它的輸入是模擬信號,首先經(jīng)過時(shí)間采樣,然后對每一樣值都進(jìn)行量化,作為數(shù)字信號的輸出,即PCM樣本序列x(0),x(1),…,x(n)。圖中的“量化,編碼”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。
如果采用相等的量化間隔處理采樣得到的信號值,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化,如(2)所示。量化后的樣本值Y和原始值X的差 E=Y-X 稱為量化誤差或量化噪聲。
非均勻量化
用均勻量化方法量化輸入信號時(shí),無論對大的輸入信號還是小的輸入信號一律都采用相同的量化間隔。為了適應(yīng)幅度大的輸入信號,同時(shí)又要滿足精度要求,就需要增加量化間隔,這將導(dǎo)致增加樣本的位數(shù)。但是,有些信號(例如話音信號),大信號出現(xiàn)的機(jī)會并不多,增加的樣本位數(shù)就沒有充分利用。為了克服這個(gè)不足,就出現(xiàn)了非均勻量化的方法,這種方法也叫做非線性量化。
非線性量化的基本想法是,對輸入信號進(jìn)行量化時(shí),大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。量化數(shù)據(jù)還原時(shí),采用相同的規(guī)則。
在語音信號的非線性量化中,采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應(yīng)關(guān)系,一種稱為m律壓擴(kuò)(m-law companding)算法,另一種稱為A律(A-law)壓擴(kuò)算法。
1.m 律壓擴(kuò)
G.711標(biāo)準(zhǔn)建議的m律壓擴(kuò)主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子(歸一化)確定量化輸入和輸出的關(guān)系:
式中:x為輸入信號幅度,規(guī)格化成 -1≤< /SPAN> x≤ 1;
sgn(x)為x的極性,x<0時(shí)為-1,否則為1;
m為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間隔之比,取100≤ m≤ 500,多取 m =255。
由于m律壓擴(kuò)的輸入和輸出關(guān)系是對數(shù)關(guān)系,所以這種編碼又稱為對數(shù)PCM。具體計(jì)算時(shí),用m=255,可以把對數(shù)曲線變成8條折線以簡化計(jì)算過程。
2.A律壓擴(kuò)
G.711標(biāo)準(zhǔn)建議的A律壓擴(kuò)主要用在中國大陸和歐洲等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:
0 ≤ | x| ≤ 1/A
1/A < |x| ≤ 1
式中:x為輸入信號幅度,規(guī)格化成 -1 ≤< /SPAN > x ≤ 1;
sgn(x)為x的極性,x<0時(shí)為-1,否則為1;
A為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間隔之比,通常取A=87.6。
A律壓擴(kuò)的前一部分是線性的,其余部分與m律壓擴(kuò)相同。A律壓擴(kuò)具有與m律壓擴(kuò)相同的基本性能(在大信號區(qū)信噪比高于m律量化器,但在小信號區(qū)不如m律量化器)和實(shí)現(xiàn)方面的優(yōu)點(diǎn),尤其是還可以用直線段很好地近似,以便于直接壓擴(kuò)或數(shù)字壓擴(kuò),并易于與線性編碼格式相互轉(zhuǎn)換。具體計(jì)算時(shí),A=87.56,為簡化計(jì)算,同樣把對數(shù)曲線部分變成13條折線。
對于采樣頻率為8 kHz,樣本精度為13比特、14比特或者16比特的輸入信號,使用m率壓擴(kuò)編碼或者使用A率壓擴(kuò)編碼,經(jīng)過PCM編碼器之后每個(gè)樣本的精度為8比特,輸出的數(shù)據(jù)率為64 kbps。這個(gè)數(shù)據(jù)就是CCITT推薦的G.711標(biāo)準(zhǔn):話音頻率脈沖編碼調(diào)制(Pulse Code Modulation (PCM) of Voice Frequencies)。通常的聽覺主觀感覺認(rèn)為8位壓擴(kuò)量化有不低于12位均勻量化A/D的信噪比及動態(tài)范圍。
華為的PCM設(shè)備有很多種,一般都是根據(jù)你的設(shè)備要接入的大網(wǎng)來選型號,根據(jù)你的業(yè)務(wù)需要來做配置。電力這塊常見的華為PCM設(shè)備有 ONU-F01&02A, FA16等等。 詳細(xì)的你可以到專業(yè)的華佳慧哪里去...
PCM彩鋼板正面一般選用高分子線性無油聚酯樹脂系涂料, 添加特殊設(shè)計(jì)的氨基樹 脂及催化劑,以獲得足夠的彎曲性和固化性;并能獲得良好的耐洗滌性,耐污染性及較高的鉛 筆硬度. 背面采用改性環(huán)氧背漆, 一方...
PCM是綜合業(yè)務(wù)接入設(shè)備。將模擬信號,數(shù)字信號數(shù)據(jù)經(jīng)光纖,雙絞線或微波延伸。具有豐富的語音和數(shù)據(jù)接口類型,大多用于公網(wǎng)與專網(wǎng),廣泛應(yīng)用于電信DDN網(wǎng)的延伸,城域網(wǎng)改造,專線電話接入,電力和公安系統(tǒng)的專...
格式:pdf
大小:273KB
頁數(shù): 未知
評分: 4.6
ADPCM是一種波形編碼,對應(yīng)的標(biāo)準(zhǔn)算法有G.721,G.726等。本文建立形式化的數(shù)學(xué)模型,分析編解碼算法及編碼前后、解碼前后信息差度量Δ1、Δ2。對0.8411秒的WAV語音實(shí)現(xiàn)了采樣頻率8KHz,數(shù)據(jù)率32Kbps的語音編碼,并很好地還原出聲音。實(shí)現(xiàn)算法時(shí)要充分考慮環(huán)境噪音。算法對[-0.1,0.1]的隨機(jī)加性噪聲有較好的魯棒性,編解碼時(shí)間穩(wěn)定,時(shí)間復(fù)雜度為O(N)。
格式:pdf
大?。?span id="uk2sq0i" class="single-tag-height">273KB
頁數(shù): 20頁
評分: 4.6
Pcm編譯碼實(shí)驗(yàn)報(bào)告 學(xué)院:信息學(xué)院 姓名:靳家凱 專業(yè):電科 學(xué)號: 20141060259 一、實(shí)驗(yàn)?zāi)康?1、 掌握脈沖編碼調(diào)制與解調(diào)的原理。 2、 掌握脈沖編碼調(diào)制與解調(diào)系統(tǒng)的動態(tài)范圍和頻率特性的定義及 測量方法。 3、 了解脈沖編碼調(diào)制信號的頻譜特性。 4、 熟悉了解 W681512。 二、實(shí)驗(yàn)器材 1、 主控&信號源模塊、 3號、 21號模塊 2、 雙蹤示波器 3、 連接線 三、實(shí)驗(yàn)原理 1、實(shí)驗(yàn)原理框圖 圖 1 21 號模塊 w68 1 5 1 2芯片的 PCM編譯碼實(shí)驗(yàn) 圖 2 3 號模塊的 PCM編譯碼實(shí)驗(yàn) 圖 3 ~μ律編碼轉(zhuǎn)換實(shí)驗(yàn) 2、實(shí)驗(yàn)框圖說明 圖 1中描述的是信號源經(jīng)過芯片 W6815 12經(jīng)行 PcM編碼和譯碼處理 。w681512 的芯片工作主時(shí)鐘為 2o48KHz, 根據(jù)芯片功能可選擇不同編碼時(shí)鐘進(jìn)行編譯碼。 在本實(shí)驗(yàn)的項(xiàng)目一中以編碼時(shí)鐘取 64K為基礎(chǔ)進(jìn)
線性預(yù)測編碼的基礎(chǔ)是假設(shè)聲音信號(濁音)是音管末端的蜂鳴器產(chǎn)生的,偶爾伴隨有嘶嘶聲與爆破聲(齒擦音與爆破音)。盡管這看起來有些原始,但是這種模式實(shí)際上非常接近于真實(shí)語音產(chǎn)生過程。聲帶之間的聲門產(chǎn)生不同強(qiáng)度(音量)與頻率(音調(diào))的聲音,喉嚨與嘴組成共鳴聲道。嘶嘶聲與爆破聲通過舌頭、嘴唇以及喉嚨的作用產(chǎn)生出來。
線性預(yù)測編碼通過估計(jì)共振峰、剔除它們在語音信號中的作用、估計(jì)保留的蜂鳴音強(qiáng)度與頻率來分析語音信號。剔除共振峰的過程稱為逆濾波,經(jīng)過這個(gè)過程剩余的信號稱為殘余信號(en:residue)。
描述峰鳴強(qiáng)度與頻率、共鳴峰、殘余信號的數(shù)字可以保存、發(fā)送到其它地方。線性預(yù)測編碼通過逆向的過程合成語音信號:使用蜂鳴參數(shù)與殘余信號生成源信號、使用共振峰生成表示聲道的濾波器,源信號經(jīng)過濾波器的處理就得到語音信號。
由于語音信號隨著時(shí)間變化,這個(gè)過程是在一段段的語音信號幀上進(jìn)行處理的。通常每秒 30 到 50 幀的速度就能對可理解的信號進(jìn)行很好的壓縮。
根據(jù)斯坦福大學(xué) Robert M. Gray 的說法,線性預(yù)測編碼起源于 1966 年,當(dāng)時(shí) NTT 的 S. Saito 和 F. Itakura 描述了一種自動音素識別的方法,這種方法第一次使用了針對語音編碼的最大似然估計(jì)實(shí)現(xiàn)。1967 年,John Burg 略述了最大熵的實(shí)現(xiàn)方法。1969 年 Itakura 與 Saito 提出了部分相關(guān)(en:partial correlation)的概念, May Glen Culler 提議進(jìn)行實(shí)時(shí)語音壓縮,B. S. Atal 在美國聲學(xué)協(xié)會年會上展示了一個(gè) LPC 語音編碼器。1971 年 Philco-Ford 展示了使用 16 位 LPC 硬件的實(shí)時(shí) LPC 并且賣出了四個(gè)。
1972 年 ARPA 的 Bob Kahn 與 Jim Forgie (en:Lincoln Laboratory, LL) 以及 Dave Walden (BBN Technologies) 開始了語音信息包的第一次開發(fā),這最終帶來了 Voice over IP 技術(shù)。根據(jù) Lincoln Laboratory 的非正式歷史資料記載,1973 年 Ed Hofstetter 實(shí)現(xiàn)了第一個(gè) 2400 位/秒 的實(shí)時(shí) LPC。1974 年,第一個(gè)雙向?qū)崟r(shí) LPC 語音包通信在 Culler-Harrison 與 Lincoln Laboratories 之間通過 ARPANET 以 3500 位/秒 的速度實(shí)現(xiàn)。1976 年,第一次 LPC 會議通過 ARPANET 使用 Network Voice Protocol 在Culler-Harrison、ISI、SRI 與 LL 之間以 3500 位/秒 的速度實(shí)現(xiàn)。最后在 1978 年,BBN 的 Vishwanath et al. 開發(fā)了第一個(gè)變速 LPC 算法。
線性預(yù)測編碼的基礎(chǔ)是假設(shè)聲音信號(濁音)是音管末端的蜂鳴器產(chǎn)生的,偶爾伴隨有嘶嘶聲與爆破聲(齒擦音與爆破音)。盡管這看起來有些原始,但是這種模式實(shí)際上非常接近于真實(shí)語音產(chǎn)生過程。聲帶之間的聲門產(chǎn)生不同強(qiáng)度(音量)與頻率(音調(diào))的聲音,喉嚨與嘴組成共鳴聲道。嘶嘶聲與爆破聲通過舌頭、嘴唇以及喉嚨的作用產(chǎn)生出來。
線性預(yù)測編碼通過估計(jì)共振峰、剔除它們在語音信號中的作用、估計(jì)保留的蜂鳴音強(qiáng)度與頻率來分析語音信號。剔除共振峰的過程稱為逆濾波,經(jīng)過這個(gè)過程剩余的信號稱為殘余信號(en:residue)。
描述峰鳴強(qiáng)度與頻率、共鳴峰、殘余信號的數(shù)字可以保存、發(fā)送到其它地方。線性預(yù)測編碼通過逆向的過程合成語音信號:使用蜂鳴參數(shù)與殘余信號生成源信號、使用共振峰生成表示聲道的濾波器,源信號經(jīng)過濾波器的處理就得到語音信號。
由于語音信號隨著時(shí)間變化,這個(gè)過程是在一段段的語音信號幀上進(jìn)行處理的。通常每秒 30 到 50 幀的速度就能對可理解的信號進(jìn)行很好的壓縮。