中文名 | 人聲編碼器 | 外文名 | voice encoder |
---|---|---|---|
學(xué)????科 | 計算機技術(shù) | 別????名 | 語音信號分析合成系統(tǒng) |
應(yīng)????用 | 合成人類語音 | 實????現(xiàn) | 硬件或軟件 |
人講話時,人聲是由喉頭的聲帶開關(guān)聲門所產(chǎn)生,其中包括了許多周期性的波形與許多諧波,這些周期波可視為基本的聲源信號。這些聲源信號接著經(jīng)由鼻子和喉嚨(可視為復(fù)雜的共振系統(tǒng)),借由改變嘴型來改變此系統(tǒng),而產(chǎn)生不同的諧波含量,創(chuàng)造了各式各樣的語音;另外濁音與塞音則是氣流經(jīng)由不同嘴型產(chǎn)生。 聲碼器發(fā)信端的分析器對話音信號進行分析,將該信號被分裂成多個頻帶(這個數(shù)字越大,會得到更準(zhǔn)確的分析)。輸入信號通過一個多頻帶濾波器,并將每個頻帶分別通過一個包絡(luò)檢測器,將包絡(luò)檢測器得到的控制信號輸出給解碼器。由于控制信號與原來的語音波形相比變化速度緩慢許多,因此聲碼器大幅降低了語音傳輸所需的頻帶。若將控制信號進行加密,則可以保證語音傳輸安全性,以防攔截。比起原始的語音資料,大約可將傳輸資料壓縮到原先的十幾分之一。 語音信號的重建則將步驟反轉(zhuǎn);接收端接到每個頻帶的包絡(luò)線參數(shù)以后,分別得到每個頻帶的包絡(luò)線,可視為多個隨時變的濾波器。接著由一個新的“豐富頻率成分”的聲源信號(可視為噪音訊號),通過每個頻帶的濾波器得到每個頻帶的包絡(luò)線訊號,最后將這些訊號得加,得到還原語音訊號。 值得注意的是,通過以上的編碼方法,丟棄了許多原本信號的資訊,主要丟棄了信息頻譜的瞬時頻率,也就是頻譜的相位。這樣的資訊流失雖然保留了語音的可辨識度,但相位的遺失意味著音高的遺失,如中文的“平、上、去、入”等五聲的資訊將遺失,而聽起來的聲音會像機器人講話一般,沒有“抑揚頓挫”。這種“機器人式”的特殊音色,在流行音樂和音效娛樂受到歡迎,在電子音樂中廣泛的被應(yīng)用。
1939年以后,已經(jīng)制出的聲碼器主要有:通道聲碼器、共振峰聲碼器、同態(tài)聲碼器、線性預(yù)測聲碼器和音素聲碼器。
通道聲碼器:在這種聲碼器中,輸入語音信號的幅度譜通過由14~20個帶通濾波器所組成的濾波器組進行分析,濾波器組把頻率范圍分成許多相鄰頻帶或通道,每個濾波器的輸出都是一個包絡(luò)緩慢變化的信號,包絡(luò)的大小反映了該頻帶內(nèi)信號的功率。所以各帶通濾波器輸出的包絡(luò)總起來就能近似表示語音信號的幅度譜。另一方面基音檢測和清濁音鑒別器提供基音周期和清油音指示。在譯碼端,有與編碼端相同的濾波器組。淸濁音指示用于選擇濾波器組的激勵源,濁音時用脈沖串,清音時用噪聲。脈沖串的頻率由基音控制,譜包絡(luò)信息則用來控制各濾波器輸出的大小,因而最終能合成與原始譜包絡(luò)相近的語音信號。通道聲碼器的語音質(zhì)量,即使在2.4kbit/s速率下也可以達到相當(dāng)高的清晰度,且抗背景噪聲的能力強,穩(wěn)定性好,因而得到了廣泛的應(yīng)用,對它的興趣多年不衰。
共振峰聲碼器:是通道聲碼器的一種變型,它在編碼的是共振峰頻率和帶寬。根據(jù)聽覺試驗的結(jié)論,一般只需傳送3~4個共振峰,因此可以達到很低的數(shù)據(jù)率。當(dāng)共振峰提取正確時,共振峰聲碼器可以在語音質(zhì)量上超過通道聲碼器而速率只需后者的一半。只是由于正確跟蹤共振峰頻率在實現(xiàn)時相當(dāng)困難,阻礙了這種聲碼器的實用,但對它的研究始終不斷。
同態(tài)聲碼器:又稱倒譜聲碼器,它傳送的模型參數(shù)是語音的倒譜和語音的幅度譜一樣,可以反映聲道的響應(yīng),但是在理論上,利用倒譜可以使語音模型中激勵源和聲道響應(yīng)的參數(shù)得到理想的分離,在理論上雖是一種方法,但在實際實現(xiàn)時同態(tài)聲碼器需要很大的計算量,數(shù)據(jù)率在相同的語音質(zhì)量下高于通道聲碼器,而且抗語音背景噪聲的能力差,所以只獲得有限的應(yīng)用。
線性預(yù)測聲碼器:是應(yīng)用最多的一種聲碼器。其最主要的特點是利用線性預(yù)測對聲道的響應(yīng)進行建模。聲碼器傳送的參數(shù)除激勵參數(shù)外,就是線性預(yù)測系數(shù)。典型的線性預(yù)測系數(shù)代表了聲道的沖激響應(yīng),但是語音質(zhì)量對這些系數(shù)的量化非常敏感,每個參數(shù)要求的比特數(shù)也較多,所以在實用時往往使用各種等價的但要求量化比特數(shù)少且對比特數(shù)不敏感的參數(shù),如反射系數(shù)和線譜對等。線性預(yù)測聲碼器的激勵模型現(xiàn)已得到改進,如采用濁音聲門波激勵模型或多脈沖激勵模型等。在進行這些改進后,線性預(yù)測聲碼器的語音質(zhì)量在聲碼器中居于前列。
音素聲碼器:聲碼器中速率最低的一種,主要由音素識別器與音素綜合器組成。但實際使用的語音單位一般不是音素而是復(fù)合音素等較大的語音單位,因為不考慮上下文影響而連接的音素串是不可懂的。這種聲碼器的語音質(zhì)量基本上已完全失去自然度,聲碼器所需的數(shù)據(jù)速率則可在200bit/s以下。
在聲碼器歷史上還出現(xiàn)過相關(guān)聲碼器、相位聲碼器以及由F.莫策提出的莫策聲碼器等。其中相位聲碼器,雖然在一般文獻上把它歸入聲碼器,實際上屬于子備編碼。它和相關(guān)聲碼器都沒有得到實際應(yīng)用,只有莫策聲碼器獲得一些應(yīng)用。2100433B
語音是人類最直接、最高效的信息交流手段。在通信技術(shù)的發(fā)展過程中,語音通話一直是大多數(shù)通信系統(tǒng)的基本功能。信息傳輸?shù)膬?nèi)容開始向多樣化的方向發(fā)展,圖像、視頻等非語音信息在通信中占據(jù)的比例逐漸增大,但是語音通話以其便宜、便捷等特點仍然是使用最多的通信方式,因此有效地傳遞語音信息仍然是眾多通信系統(tǒng)的必備功能之一。在數(shù)字通信系統(tǒng)中,原始語音信號必須經(jīng)過數(shù)字化后才能傳輸,但數(shù)字化后的語音信號存在大量冗余。對語音信號進行編碼能夠有效地去除數(shù)字語音信號中的冗余信息,降低編碼速率,因此語音編碼技術(shù)在現(xiàn)代通信系統(tǒng)中有著廣泛地應(yīng)用 。
人聲編碼器或聲碼器,一種語音信號編碼譯碼器。利用語音信號模型語音分析合成的系統(tǒng)。傳播時只利用模型參數(shù),編譯碼時利用模型參數(shù)估計和語音合成技術(shù)。其語音模型中,語音被看作為一個快速變化的激勵信號送入一個緩慢變化的聲道濾波器后所得的輸出。激勵信號在清音時為噪聲,濁音時為具有基音周期的脈沖串。語音模型中的語音信號用兩組參數(shù)表示。一組為激勵源參數(shù),包括清濁音指示、基音頻率和振幅;另一組為聲道濾波器的響應(yīng)參數(shù),參數(shù)不同,聲碼器類型也不同。傳輸?shù)氖侨コ苏Z音信號中冗余度的模型參數(shù)。壓縮比大,但也因丟失了語音的某些細(xì)節(jié),給語音信號的自然度帶來較大影響。已研究出來的聲碼器有通道聲碼器、共振峰聲碼器、同態(tài)聲碼器、線性預(yù)測聲碼器和音素聲碼器。聲碼器早期應(yīng)用于軍事通信,壓縮比雖大,但重建語音質(zhì)量較差。采用線性預(yù)測的聲碼器在語音質(zhì)量上已可達到電話通信的要求,在移動通信、話音存儲轉(zhuǎn)發(fā)和可視電話等領(lǐng)域具有廣泛的應(yīng)用前景。
聲碼器的明顯優(yōu)點是數(shù)碼率低,因而適合于窄帶、昂貴和劣質(zhì)信道條件下的數(shù)字電話通信,能滿足節(jié)約頻帶、節(jié)省功率和抗干擾編碼的要求。低數(shù)碼率對話音存儲和話音加密處理也都很有利。聲碼器的缺點是音質(zhì)不如普通數(shù)字電話好,而且工作過程較復(fù)雜,造價較高?,F(xiàn)代聲碼器主要用于軍隊、政府以及那些值得付出代價以換取通信安全(保密)的場合。隨著對人類發(fā)聲機構(gòu)和聽覺機理的深入研究以及計算機技術(shù)和大規(guī)模集成電路的發(fā)展,聲碼器的音質(zhì)和設(shè)備小型化將不斷得到改進,并將在數(shù)字通信中得到更廣泛的應(yīng)用。
聲碼器對話音存儲和話音加密處理很有利、有算法,速度快、質(zhì)量好且結(jié)構(gòu)簡單、適合于窄帶、昂貴和劣質(zhì)信道條件下的數(shù)字電話通信。但工作過程復(fù)雜,價格高,音質(zhì)有點差。
分辨率1000P/R,開路輸出。
PG是脈沖發(fā)生器(Pulse Generator)的縮寫PG的功能的是產(chǎn)生脈沖信號,信號主要含兩方面信息1,檢測轉(zhuǎn)子的磁極位置,并根據(jù)該位置通入電流2,檢測機械的位置和速度
指的是增量型編碼器的分辨率。它用編碼器每圈輸出的脈沖數(shù)(pulse per revolution )來表示。PPR 是pulse per revolution 的縮寫。
編碼器常見故障
1、編碼器本身故障:是指編碼器本身元器件出現(xiàn)故障,
編碼器(圖2)
導(dǎo)致其不能產(chǎn)生和輸出正確的波形。這種情況下需更換編碼器或維修其內(nèi)部器件。
2、編碼器連接電纜故障:這種故障出現(xiàn)的幾率 最高,維修中經(jīng)常遇到,應(yīng)是優(yōu)先考慮的因素。通常為編碼器電纜斷路、短路或接觸不良,這時需更換電纜或接頭。還應(yīng)特別注意是否是由于電纜固定不緊,造成松動引起開焊或斷路,這時需卡緊電纜。
3、編碼器+5V電源下降:是指+5V電源過低, 通常不能低于4.75V,造成過低的原因是供電電源故障或電源傳送電纜阻值偏大而引起損耗,這時需檢修電源或更換電纜。
4、絕對式編碼器電池電壓下降:這種故障通常有含義明確的報警,
編碼器(圖3)
這時需更換電池,如果參考點位置記憶丟失,還須執(zhí)行重回參考點操作。
5、編碼器電纜屏蔽線未接或脫落:這會引入干擾信號,使波形不穩(wěn)定,影響通信的準(zhǔn)確性,必須保證屏蔽線可靠的焊接及接地。
6、編碼器安裝松動:這種故障會影響位置控制 精度,造成停止和移動中位置偏差量超差,甚至剛一開機即產(chǎn)生伺服系統(tǒng)過載報警,請?zhí)貏e注意。
7、光柵污染 這會使信號輸出幅度下降,必須用脫脂棉沾無水酒精輕輕擦除油污。
編碼器在OEM市場的應(yīng)用比例較高,主要應(yīng)用于機床、電梯、伺服電機配套、紡織機械、包裝機械、印刷機械、起重機械等行業(yè)。2010年,中國OEM市場的高速增長拉動了編碼器市場的迅猛增長,2010年中國編碼器市場的市場規(guī)模達到13億元,同比增長42.9%。
從行業(yè)來看,電梯、機床和伺服電機配套是編碼器的重點應(yīng)用領(lǐng)域,占整體應(yīng)用市場53%的市場份額。紡織機械、包裝機械和印刷機械等領(lǐng)域目前市場份額較小,編碼器一般不直接進入這三個行業(yè),編碼器生產(chǎn)企業(yè)的競爭主要集中在給這些機械行業(yè)提供伺服電機的電機生產(chǎn)廠環(huán)節(jié)。起重機械目前市場份額也較小,僅占4%-5%。在冶金和電子行業(yè)等項目型行業(yè),編碼器目前應(yīng)用比例較低,僅占14%的市場份額。此外,編碼器在醫(yī)療機械、風(fēng)電、汽車生產(chǎn)線、混合動力汽車、水利、軌道交通等領(lǐng)域也有一定應(yīng)用,但應(yīng)用比例較低。
2010年風(fēng)電行業(yè)自動化產(chǎn)品需求增長達到了50%以上,而電梯、伺服電機、紡織機械以及機床等編碼器的主要應(yīng)用領(lǐng)域增長也比較明顯,是拉動增長的主要來源。
從廠商來看,目前歐美品牌占據(jù)高端市場,占三分之一以上的市場份額,產(chǎn)品價格定位高端,在重工和風(fēng)電等新能源領(lǐng)域具有優(yōu)勢;日韓品牌主要占據(jù)中端市場,也占三分之一以上的市場份額,產(chǎn)品價格定位中端,在電梯、機床、伺服電機等行業(yè)應(yīng)用較為廣泛;而大陸企業(yè)主要參與中低端市場的競爭,產(chǎn)品價格較低,以占市場近半銷售量僅獲得25%的大陸市場銷售份額。
市場份額較高的企業(yè)包括Heidenhain、Tamagawa、Nemicon、Yuheng、Baumer、Rep、P+F、Danaher、Koyo、Omron等。其中前三名企業(yè)市場份額占市場總額的將近50%,市場集中度較高,各企業(yè)主要針對的應(yīng)用行業(yè)集中性較高、行業(yè)競爭較少。主流廠商業(yè)績增長幅度也有明顯差距,增長幅度最大的為60%,增長幅度最小的低于10%。
編碼器分為絕對值型和增量型。目前絕對值編碼器的價格大約是增量型編碼器的4倍以上,國內(nèi)市場上70%的應(yīng)用是價格相對經(jīng)濟的增量型編碼器,主要應(yīng)用在如包裝、紡織、電梯等行業(yè)中僅要求測量轉(zhuǎn)速及對絕對位置測量要求不高的機器設(shè)備上。而在高精度機械設(shè)備或鋼鐵、港口及起重等重工業(yè)行業(yè),由于對測量的精度要求相對較高,更多情況會使用絕對值編碼器。在這些重工業(yè)行業(yè)應(yīng)用中,由于工況比較惡劣,所以對編碼器的抗沖擊和振動等指標(biāo)要求較高。
隨著機械設(shè)備自動化程度的提高,編碼器產(chǎn)品的應(yīng)用領(lǐng)域也越來越廣泛,客戶已不再滿足于編碼器僅能將物理的旋轉(zhuǎn)信號轉(zhuǎn)換為電信號,還要求編碼器集成度更高,產(chǎn)品更加耐用,并且希望能在絕對值編碼器中出現(xiàn)更豐富的接口方式,使更多的設(shè)備實現(xiàn)智能化。
目前整個工業(yè)市場中生產(chǎn)安全及通信安全越來越被重視,國家層面也開始對產(chǎn)品的安全性能提出要求,編碼器在安全標(biāo)準(zhǔn)方面也有相應(yīng)規(guī)范,但由于國內(nèi)編碼器市場對產(chǎn)品技術(shù)要求相對較低,客戶對中低端產(chǎn)品更為青睞。
OMRON編碼器是用來測量轉(zhuǎn)速的裝置,光電式旋轉(zhuǎn)編碼器通過光電轉(zhuǎn)換,可將輸出軸的角位移、角速度等機械量轉(zhuǎn)換成相應(yīng)的電脈沖以數(shù)字量輸出(REP)。它分為單路輸出和雙路輸出兩種。技術(shù)參數(shù)主要有每轉(zhuǎn)脈沖數(shù)(幾十個到幾千個都有),和供電電壓等。單路輸出是指旋轉(zhuǎn)編碼器的輸出是一組脈沖,而雙路輸出的旋轉(zhuǎn)編碼器輸出兩組A/B相位差90度的脈沖,通過這兩組脈沖不僅可以測量轉(zhuǎn)速,還可以判斷旋轉(zhuǎn)的方向。