畢業(yè)設(shè)計(論文)-GSM移動通信系統(tǒng)的語音編碼技術(shù)研究_第1頁
畢業(yè)設(shè)計(論文)-GSM移動通信系統(tǒng)的語音編碼技術(shù)研究_第2頁
畢業(yè)設(shè)計(論文)-GSM移動通信系統(tǒng)的語音編碼技術(shù)研究_第3頁
畢業(yè)設(shè)計(論文)-GSM移動通信系統(tǒng)的語音編碼技術(shù)研究_第4頁
畢業(yè)設(shè)計(論文)-GSM移動通信系統(tǒng)的語音編碼技術(shù)研究_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

PAGE襄樊學(xué)院畢業(yè)論文(設(shè)計)PAGEPAGE16GSM移動通信系統(tǒng)的語音編碼技術(shù)研究SpeechCodingTechniquesofGSMMobileCommunicationSystem目錄內(nèi)容摘要 IAbstract II第一章引言 1第二章GSM移動通信系統(tǒng) 2§2.1GSM移動通信系統(tǒng)簡介 82\h2§2.2GSM移動通信系統(tǒng)的總體結(jié)構(gòu) 2§2.2.1移動臺(MobileStation) 2§2.2.2基站子系統(tǒng)BSS(BaseStationSub-system) 2§2.2.3網(wǎng)絡(luò)子系統(tǒng)NSS(NetworkSub-system) 2§2.2.4操作支持子系統(tǒng)OSS(OperationsSub-system) 3HYPERLINK\l"_Toc191530488"第三章GSM系統(tǒng)的語音編碼簡介 4第四章語音編碼的發(fā)展現(xiàn)狀 5第五章語音編碼質(zhì)量的評定 7§5.1客觀評定方法 7§5.2主觀評定方法 7§6.1語音編碼技術(shù)的分類 8§6.1.1波形編碼 PAGEREF_Toc191530494\h8§6.1.2聲碼器 9§6.1.3混合編碼 10§6.2分析GSM系統(tǒng)中的語音編碼技術(shù)—多脈沖激勵LPC PAGEREF_Toc191530497\h10§6.2.1多脈沖激勵LPC編碼器的組成 11§6.2.2編碼過程 11§6.2.3多脈沖激勵LPC譯碼器的組成 PAGEREF_Toc191530500\h11第七章語音編碼芯片 12第八章語音編碼技術(shù)進展 13結(jié)束語 14HYPERLINK\l"_Toc191530504"參考文獻 15致謝 16畢業(yè)論文(設(shè)計)文926內(nèi)容摘要由于GSM系統(tǒng)的技術(shù)成熟、管理靈活、完善的技術(shù)規(guī)范,在歐洲取得很大的成功之后,在世界上許多國家更是得到廣泛的應(yīng)用,已成為陸地公用移動通信系統(tǒng)的主要系統(tǒng)。而GSM系統(tǒng)中語音編碼是很重要的,因為語音編碼往往決定了接受到的語音質(zhì)量和系統(tǒng)的容量。在移動通信系統(tǒng)中,信道帶寬始終是一個突出的問題。因此,業(yè)務(wù)提供商面臨的問題是:如何在有限的可分配的帶寬內(nèi)容納更多的用戶?由此可見GSM移動電話系統(tǒng)中語音編碼技術(shù)仍然有廣泛的前景。現(xiàn)代通信的重要標志是實現(xiàn)數(shù)字化,而要實現(xiàn)數(shù)字化首先得把模擬信號變換成為數(shù)字信號,這種變換對語音信號來說就是語音編碼。為了提高語音編碼和語音信號數(shù)字傳輸?shù)挠行裕ǔ_€要進行語音壓縮編碼,這就是本文要討論的中心課題。關(guān)鍵詞:GSM,編碼技術(shù),語音編碼,參量編碼

AbstractBecauseofitstechnicalmaturity,flexiblemanagementandgoodtechnicalnorms,theGSMsystemhasbeenusedwidelyinmanycountriesafteritachievedgreatsuccessinEurope.Andnowithasbecomeacommonsystemformobilecommunicationssystemallovertheworld.GSMvoice-codingsystemisveryimportantbecausevoice-codingoftenseesthedecisionofvoicequalityandsystemcapacity.Inthemobilecommunicationsystem,channelbandwidthisaprominentproblem.Therefore,thebusinessprovidersfaceaproblemisthathowcanthelimiteddistributionofthebandwidthsatisfymorecustomers?SoGSMmobiletelephonesystemvoicecodingtechnologyisabroadprospect.Animportantindicatorinmoderncommunicationsisdigital.Inordertotransformanalogsignalsintodigitalsignals,whichtransformationofthespeechsignalexampleiscalledspeechcode.Toimprovespeechcodingandvoicesignalsinthevalidityofdigitaltransmission,voicemustbecoded,whichisthecentralissueinthepaperKeywords:GSM,Codingtechnology,Voicecoding,Parametercoding第一章引言移動通信發(fā)展到現(xiàn)在,經(jīng)歷了由模擬到數(shù)字的變化,早期的移動通信系統(tǒng)是AMPS和ETACS為代表的模擬移動通信系統(tǒng)。90年代,隨著移動通信擁護數(shù)量的增加,用戶對跨地區(qū),跨國漫游以及各種增值服務(wù)要求也隨之增加,同時數(shù)字通信技術(shù)發(fā)展也日趨成熟,歐洲的移動通信運營商開始考慮發(fā)展一種新型的數(shù)字移動通信系統(tǒng),由于數(shù)字通信系統(tǒng)的優(yōu)點,如:頻譜效率高、容量大、業(yè)務(wù)種類多、保密性好、話音質(zhì)量好、網(wǎng)絡(luò)管理能力強等,使得數(shù)字通信網(wǎng)得到迅猛發(fā)展。特別是GSM系統(tǒng),技術(shù)成熟、管理靈活、有完善的技術(shù)規(guī)范,在歐洲取得很大的成功之后,在世界上許多國家更是得到廣泛的應(yīng)用,已成為陸地公用移動通信的主要系統(tǒng)[3]。在移動系統(tǒng)中,語音編碼是很重要的,因為語音編碼往往決定了接受到的語音質(zhì)量和系統(tǒng)的容量[5]。由于大容量通信信道的引入,一段時間內(nèi)曾認為語音壓縮技術(shù)已經(jīng)沒有研究的必要,因為語音壓縮相對于光纖信道容量來說已經(jīng)微不足道。實際上,光纖信道目前也只是在骨干網(wǎng)上得到應(yīng)用,在接入網(wǎng)及支線的大規(guī)模應(yīng)用仍需要一定的時間。另外,在移動通信系統(tǒng)中,信道帶寬始終是一個突出的問題。因此,業(yè)務(wù)提供商面臨的問題是:如何在有限的可分配的帶寬內(nèi)容納更多的用戶。由此可見GSM移動電話系統(tǒng)中,低速率語音編碼技術(shù)仍然有廣泛的應(yīng)用前景。在編碼器能夠傳送高質(zhì)量語音的前提下,如果比特率低,就能夠在一定的帶寬內(nèi)容納更多的語音通道。

第二章GSM移動通信系統(tǒng)§2.1GSM移動通信系統(tǒng)簡介GSM全稱數(shù)字蜂窩移動通信系統(tǒng)(GlobalSystemforMobileCommunication),俗稱“全球通”,目前我國的移動通信網(wǎng)就是以GSM系統(tǒng)為基礎(chǔ)的移動網(wǎng)絡(luò)系統(tǒng)。它依照歐洲通信標準化委員會(ETSI)制定的GSM規(guī)范研制而成,是第二代移動通信技術(shù)(2G)。其開發(fā)目的是讓全球各地可以共同使用一個移動電話網(wǎng)絡(luò)標準,讓用戶使用一部手機就能行遍全球。§2.2GSM移動通信系統(tǒng)的總體結(jié)構(gòu)GSM移動通信系統(tǒng)是一種典型的基于TDMA的數(shù)字蜂窩移動通信系統(tǒng),總體結(jié)構(gòu)由以下功能單元組成[10]:§2.2.1移動臺(MobileStation)它包括移動設(shè)備(ME)和用戶識別模塊(SIM)。根據(jù)業(yè)務(wù)的狀況,移動設(shè)備可包括移動終端(MT),終端適配功能(TAF)和終端設(shè)備(TE)等功能部件。§2.2.2基站子系統(tǒng)BSS(BaseStationSub-system)1)基站(BTS):為一個小區(qū)服務(wù)的無線收發(fā)信設(shè)備。2)基站控制器(BSC):具有對一個或多個BTS進行控制以及相應(yīng)呼叫控制的功能,BSC以及相應(yīng)的BTS組成了BSS(基站子系統(tǒng))。BSS是在一定的無線覆蓋區(qū)中,由移動業(yè)務(wù)交換中心(MSC)控制,與MS進行通信的系統(tǒng)設(shè)備。

a.接口管理

b.BTS-BSC之間的地面信道管理

c.無線參數(shù)及無線資源管理

d.測量和統(tǒng)計

e.切換3)基站發(fā)信臺(BTS):受控于基站控制器(BSC),屬于基站子系統(tǒng)(BSS)的無線部分,服務(wù)于某小區(qū)的無線收發(fā)信設(shè)備,實現(xiàn)BTS與移動臺(MS)空中接口的功能。BTS主要分為基帶單元、載頻單元和控制單元三部分。基帶單元主要用于話音和數(shù)據(jù)速率適配以及信道編碼等;載頻單元主要用于調(diào)制/解調(diào)與發(fā)射機/接收機間的耦合;控制單元則用于BTS的操作與維護。BTS中存儲編碼算法A5和密鑰Kc,用于解密接收到的密文形式的用戶數(shù)據(jù)和信令數(shù)據(jù)(包括解密)。§2.2.3網(wǎng)絡(luò)子系統(tǒng)NSS(NetworkSub-system)1)移動業(yè)務(wù)交換中心(MSC):對于位于它管轄區(qū)域中的移動臺進行控制交換的功能實體。2)拜訪位置寄存器(VLR):MSC為所管轄區(qū)域中MS的呼叫接續(xù),所需檢索信息的數(shù)據(jù)庫。VLR存儲與呼叫處理有關(guān)的一些數(shù)據(jù),例如用戶的號碼,所處位置區(qū)的識別,向用戶提供的服務(wù)等參數(shù)。3)歸屬位置寄存器(HLR):管理部門用于移動用戶管理的數(shù)據(jù)庫。每個移動用戶都應(yīng)在其歸屬位置寄存器注冊登記。HLR主要存儲兩類信息,有關(guān)用戶的參數(shù)和有關(guān)用戶目前所處位置的信息。

4)設(shè)備識別寄存器(EIR):存儲有關(guān)移動臺設(shè)備參數(shù)的數(shù)據(jù)庫。主要完成對移動設(shè)備的識別、監(jiān)視、閉鎖等功能。

5)鑒權(quán)中心(AUC):認證移動用戶的身份和產(chǎn)生相應(yīng)鑒權(quán)參數(shù)(隨機數(shù)RAND,符號響應(yīng)SRES,密鑰Kc)的功能實體。§2.2.4操作支持子系統(tǒng)OSS(OperationsSub-system)操作維護系統(tǒng)中的各功能實體。依據(jù)廠家的實現(xiàn)方式可分為無線子系統(tǒng)的操作維護中心(OMC-R)和交換子系統(tǒng)的操作維護中心(OMC-S)。GSM系統(tǒng)可通過MSC實現(xiàn)與多種網(wǎng)絡(luò)的互通,包括PSTN、ISDN、PLMN和PSPDN。以上是GSM的四個分系統(tǒng),各分系統(tǒng)之間都有定義明確且詳細的標準化接口方案,保證任何廠商提供的GSM系統(tǒng)設(shè)備可以互連。同時,GSM系統(tǒng)與各種公用通信網(wǎng)之間也都詳細定義了標準接口規(guī)范,使GSM系統(tǒng)可以與各種公用通信網(wǎng)實現(xiàn)互連互通。GSM系統(tǒng)除了可以開放基本的話音業(yè)務(wù)外,還可以開放各種承載業(yè)務(wù)、補充業(yè)務(wù)以及與ISDN相關(guān)的各種業(yè)務(wù)。GSM系統(tǒng)采用FDMA/TDMA及跳頻的復(fù)用方式,頻率重復(fù)利用率較高,同時它具有靈活方便的組網(wǎng)結(jié)構(gòu),可滿足用戶的不同容量需求。GSM系統(tǒng)具有較強的鑒權(quán)和加密功能,能確保用戶和網(wǎng)絡(luò)的安全需求,系統(tǒng)抗干擾能力較強,通信質(zhì)量教高[2]。GSM系統(tǒng)工作頻段分配為:GSM900MHz頻段為:890~915MHz(移動臺發(fā),基站收),935~960MHz(基站發(fā),移動臺收);DCS1800MHz頻段為:1710~1785MHz(移動臺發(fā),基站收),1805~1880MHz(基站發(fā),移動臺收)。

第三章GSM系統(tǒng)的語音編碼簡介語音編碼就是對模擬的語音信號進行編碼,將模擬信號轉(zhuǎn)化成數(shù)字信號,從而降低傳輸碼率并進行數(shù)字傳輸,語音編碼的基本方法可分為波形編碼和參量編碼,波形編碼是將時域的模擬話音的波形信號經(jīng)過取樣、量化、編碼而形成的數(shù)字話音信號,參量編碼是基于人類語言的發(fā)音機理,找出表征語音的特征參量,對特征參量進行編碼[1]。歐洲GSM系統(tǒng)用的是剩余激勵性預(yù)測編碼/長期預(yù)測(RELP/LPT)。這種方法把來自送話器的話音信號經(jīng)過8kHz抽樣,13bits均勻量化變?yōu)?04kbps的數(shù)據(jù)流,數(shù)據(jù)流進入話音編碼器進行規(guī)則脈沖激勵-長期預(yù)測(RPE-LTP)編碼。PRE-LTP編碼屬于中速率混合型編碼,為提取特征參數(shù)而作的語音分析利用了語音信號的準平穩(wěn)性,即在10~20ms的短時間內(nèi)可認為語音的特征參數(shù)不變。因此可將實際語音信號分成短時間段,在各個段內(nèi)分別進行參量提取。GSM系統(tǒng)的編碼處理是按幀進行的,每幀20ms,含160個語音樣本,經(jīng)話音編碼后為260bits的編碼塊,即話音編碼后的信號速率為13kbps。同時GSM標準(PHASE2+)要求移動臺對語音進行檢測,將每個時間段分為有聲段和無聲段。在有聲段,進行語音編碼產(chǎn)生編碼語音幀;在無聲段,對背影噪聲進行估計,產(chǎn)生SID幀(靜寂描述幀)。發(fā)射機采用不連續(xù)發(fā)射方式,即僅在包含語音幀的時間段內(nèi)才開發(fā)射機。SID幀是在語音段結(jié)束時發(fā)射的。接收端根據(jù)受到的SID幀的信息在無聲期內(nèi)插入舒適噪聲。13kbps的話音信號進入信道編碼進行編碼。RELP/LPT編碼后每幀長20ms,編碼速率為13kbps,有希望降到6.5kbps,這是一種既簡化編碼又能使合成波形失真較小的方法。

第四章語音編碼的發(fā)展現(xiàn)狀按照不同使用要求,目前已研究出不同的語音編碼方法,并制定了相應(yīng)的標準,在表1中對這些標準作了歸納。由此表可見,64和32kbps編碼技術(shù)已經(jīng)成熟,早已制定出國際標準算法。16kbps編碼方法,CCITT也已于前面發(fā)布了建議(G.728),其基本要求是:語音質(zhì)量足以適應(yīng)多級編譯碼、處理時延低,足以克服回聲影響,以及處理音頻的非語音信號的能力。CCITT的建議采用一種后向自適應(yīng)低延遲碼激勵線性預(yù)測(LowDelay-CodeExcitedLinearPrediction.LD-CELP)算法[15]。表1編碼速率(kbps)64321613標準制定年代1972198619911988198919891975標準制定組織CCITTCCITTCCITTGSMCTIANSANSA海事衛(wèi)星編碼方法PCMADPCMLD-CELPRPE-LTPVSELPCELPLPCMBE語音質(zhì)量MOS4.34.14≥3.73.0+2.5*DRT959494*93+93+90DAM736870*68*67-54主要用途通信網(wǎng)移動通信

語音郵件保密電話

移動通信注:CCITTConsulatativeCommunicateforTelephoneandTelegraphGSMGroupSpecialMobialeCTIACeluarTechnologyIndustryAssociationNSANationalSecurityAgency*—估計值,–—上界,+—下界由上述可見,自64kbps至16kbps的語音編碼質(zhì)量,目前已可達到近于透明(MOS分4.0以上)的質(zhì)量標準。13kbps及8kbps的語音編碼都是為移動通信制定的。13kbps是歐共體國家制定的標準,它采用規(guī)則脈沖激勵長時線性預(yù)測(RegularPulseExcited-longTermPrediction,RPE-LTP)方案。8kbps是美國CTIA制定的標準,它采用矢量和激勵線性預(yù)測(VectorSumExcitedLinearPrediction,VSELP)方案。它們的質(zhì)量僅達到了“通信質(zhì)量”(MOS3.5以上)尚未達到透明或近于透明。這一級的語音編碼方法還有待于進一步研究,提高語音質(zhì)量。海事衛(wèi)星組織(Inmarsat)制定的6.4kbps標準采用多帶激勵(Multi-BandExcited,MBE)線性預(yù)測算法。6.4kbps中僅4.15kbps用于語音編碼,其余2.25kbps用于糾錯編碼。更低速率的語音編碼標準速率為4.8kbps和2.4kbps。2.4kbps的語音編碼信號由于可以通過2.4kbps的全雙工調(diào)解器進入PSTN,使用價值極大,一直是人們研究和關(guān)注的重點。美國國防部國家安全局已于1975年制定了一個標準(LPC-10),采用典型參量編碼—線性預(yù)測方案,語音質(zhì)量不能另人滿意。因此,美國國防部在新的標準LPC-10e,它是在原方案基礎(chǔ)上改進的。新方案的語音質(zhì)量有所提高,但是對于非語音(例如,咳嗽、口哨、脈沖噪聲等)信號的處理還不另人滿意。因此,1988年12月美國國防部又頒布了1.8kbps標準。它的語音質(zhì)量教好,抗干擾和環(huán)境噪聲能力強,清晰度測試得分高于16kbps連續(xù)變斜率增量調(diào)制CVSD)的性能,達到DRT93%,可以和32kbps的CVSD質(zhì)量相比較。這個4.8kbps標準采用的是一種混合編碼算法(CELP),這種方案具有今后擴展的可能,并具有抗信道誤碼和環(huán)境噪聲的能力。目前,這一方案可以用單片新一代的DSP實現(xiàn),它將用于美國地面移動通信網(wǎng)中。NASA表示將采用它于移動衛(wèi)星通信網(wǎng)中,NATO也將要規(guī)定其作為NATO的標準。

第五章語音編碼質(zhì)量的評定在語音編碼技術(shù)中,對語音質(zhì)量的評價是一個很重要的問題。如何評價語音編碼質(zhì)量歸納起來大致可以分為兩類,即客觀評定方法和主觀評定方法[11]。§5.1客觀評定方法用客觀測量的手段來評價語音編碼的質(zhì)量,常用的方法有信噪比,加權(quán)信噪比,平均分段信噪比等。它們都是建立在度量均方誤差的基礎(chǔ)上,其特點是計算簡單,但是不能完全反應(yīng)人對語音質(zhì)量的感覺。這個問題對于速率為16Kbits/s以下的中、低速率語音編碼尤為突出,因此主要適用于速率較高的波形編碼類型。§5.2主觀評定方法該方法符合人類聽話時對語音質(zhì)量的感覺,因而目前得到廣泛應(yīng)用。最主要的主觀評定方法是主觀評定等級(SubjectiveOpinionScale),或稱平均評價得分(MeanOpinionScore)MOS等級。MOS得分采用五級評分標準,其方法是,由數(shù)十名視聽者在相同信道環(huán)境中視聽并給予評分,然后對評分進行統(tǒng)計處理,求出平均得分。由于主觀和客觀上的種種原因,每次視聽所得的評分會有波動。為了減小波動的誤差,除了試聽者人數(shù)要足夠多之外,所測語音材料也要足夠豐富,視聽環(huán)境也應(yīng)盡量保持相同[12]。另外,試聽者對語音質(zhì)量的主觀感覺往往是何其注意力集中程度相聯(lián)系的,因而,對應(yīng)于主觀評定等級,還有一個收聽注意力等級(ListeningEffectScale)。表2給出主觀評定等級的質(zhì)量等級,分數(shù)和相應(yīng)的收聽注意力等級。從用戶角度看,通常認為MOS分4.04.5分為高質(zhì)量語音編碼,達到長途電話網(wǎng)的質(zhì)量要求。MOS分3.5分左右稱為通信質(zhì)量,這時聽者能夠感覺到語音質(zhì)量有所下降,但不影響正常的通話,可以滿足多數(shù)通信系統(tǒng)的使用要求。MOS分3.0分以下常稱為合成語音質(zhì)量,這種語音一般只有足夠高的可懂度,但是自然度教差,不容易識別講話者,這樣話音質(zhì)量不超過3分[13]。質(zhì)量等級分數(shù)收聽注意力等級優(yōu)5可完全放松,不需要注意力良4需要注意,但不需明顯集中注意力滿意(正常)3中等程度的注意力差2需要集中注意力劣1即使努力去聽,也很難聽懂表2

第六章語音編碼技術(shù)§6.1語音編碼技術(shù)的分類語音編碼主要有三種方式:波形編碼、聲碼器和混合編碼,通常把編碼速率低于64kbps的語音編碼方式稱為語音壓縮編碼技術(shù).下面分別介紹這三種編碼方法。§6.1.1波形編碼波形編碼是將時間域信號直接變換為數(shù)字代碼,力圖使重建語音波形保持原語音信號的波形形狀。波形編碼的基本原理是在時間軸上對模擬語音按一定的速率抽樣,然后將幅度樣本分層量化,并用代碼表示。解碼是其反過程,將收到的數(shù)字序列經(jīng)過解碼和濾波恢復(fù)成模擬信號。可以看出,波形編碼的設(shè)計基本上是與信號源分離的,因此對各種各樣的信號進行編碼均可以達到很好的效果。波形編碼包括時域編碼和頻域編碼。①時域編碼.時域編碼主要有脈沖編碼調(diào)制(PCM)、增量調(diào)制(ΔM)、自適應(yīng)差分脈碼調(diào)制(ADPCM)、自適應(yīng)增量調(diào)制(ADM)、自適應(yīng)預(yù)測編碼(APC)等.線性PCM是用同等的量化級進行量化,沒有利用聲音的性質(zhì),所以信息沒有得到壓縮,對數(shù)PCM利用了語音信號幅度的統(tǒng)計特性,對幅度按對數(shù)變換壓縮,將壓縮的結(jié)果作線性編碼,在接收端解碼時,按指數(shù)擴展,這種方法在數(shù)字電話通信中得到了廣泛的應(yīng)用,現(xiàn)有的PCM采用編碼速率為64kbps的A律μ律對數(shù)壓擴方法.由于對數(shù)PCM廣泛應(yīng)用于通信系統(tǒng)中,而線性PCM可以直接進行二進制運算,所以一般速率低于64kbps的語音編碼系統(tǒng)多是先進行對數(shù)PCMO線性PCM變換后,再采用信號處理器進行語音信號數(shù)字處理.PCM最大缺點是數(shù)碼率高,在傳輸時所占頻帶較寬.差分脈碼調(diào)制(DPCM)是根據(jù)相鄰采樣值的差值信號進行編碼,ADPCM是在DPCM的基礎(chǔ)上發(fā)展起來的,其量化器與預(yù)測器的參數(shù)能根據(jù)輸入信號的統(tǒng)計特性自適應(yīng)于最佳或接近于最佳參數(shù)狀態(tài).ADPCM是語音編碼中復(fù)雜程度較低的一種方法.增量調(diào)制是根據(jù)信號的瞬值是否增大或減小,即根據(jù)增量編碼,用一位二進制碼序列對模擬信號進行編碼.這種方法簡單,實現(xiàn)容易,但由于量階固定,量化噪聲功率固定,所以當(dāng)信號下降時,信噪比(SNR)下降.為了改進這種方法的動態(tài)范圍,引進了自適應(yīng)技術(shù),讓量階的大小隨輸入信號的統(tǒng)計特性變化而變,這種方法稱為自適應(yīng)增量調(diào)制(ADM).CVSD是讓量階的大小隨音節(jié)時間間隔(5~20ms)中信號平均斜率變化,信號的斜率是通過輸出連“0”或連“1”來檢測的.ADM編碼器簡易,同步簡單,成本低,是數(shù)字移動通信中較好的一種語音編碼方法.APC是根據(jù)語音的統(tǒng)計特性,由過去的采樣值精確預(yù)測出當(dāng)前樣值的一種編碼方法,它是通過自適應(yīng)預(yù)測器來提高預(yù)測精度的,預(yù)測得越精確,編碼速率越低,這種方法可以做到低速率(10kbps以下),并且音質(zhì)與電話音質(zhì)相似.[6]②頻域編碼.頻域編碼方式主要有子帶編碼(SBC)和自適應(yīng)變換編碼(ATC)SBC是利用帶通濾波器將語音頻帶分成若干子帶,并且分別進行采樣、編碼,編碼方式可以用ADPCM或ADM,SBC速率可以達到9.6kbps.可變SBC可使子帶的設(shè)計不固定,而是隨共振峰變化,使編碼速率進一步提高,這種方式在速率為4.8kbps時可具有相當(dāng)于7.2kbps的固定SBC的語音質(zhì)量.ATC是先將語音信號在時間上分段,每一段信號一般有64~512個采樣,再將每段時域語音數(shù)據(jù)經(jīng)正交變換轉(zhuǎn)換到頻域,得到相應(yīng)的各組頻域系數(shù),然后分別對每一組系數(shù)的每個分量單獨量化、編碼和傳輸,在接收端解碼得到的每組系數(shù)再進行頻域至?xí)r域的反變換,恢復(fù)時段信號,最后將各時段連接成語音信號,ATC編碼在速率為12~16kbps可得到優(yōu)質(zhì)語音.脈沖編碼調(diào)制(PCM)、差分脈沖編碼調(diào)制(DPCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)、增量調(diào)制(△M)、自適應(yīng)增量調(diào)制(ADM)、連續(xù)可變斜率增量調(diào)制(CVSDM)、自適應(yīng)預(yù)測編碼(APC)、自適應(yīng)變換編碼(ATC)、子帶編碼(SBC)等,都屬于波形編碼技術(shù)。波形編碼器從64Kbit/s到16Kbit/s的比特率,如果速率在16Kbit/s以下,語音波形編碼的話音質(zhì)量通常迅速下降[8]。波形編碼適用于很寬范圍的語音特性,以及在噪音環(huán)境下,它們都保持穩(wěn)定。因此,它具有適應(yīng)能力強、語音質(zhì)量(64kbpsPCM的MOS一般為4.3分)好等優(yōu)點。但是所用的編碼速率高,在對信號帶寬要求不太嚴格的通信中得到應(yīng)用,而對于頻率資源相對緊張的GSM系統(tǒng)來說,這種編碼方式顯然不合適。§6.1.2聲碼器所謂聲碼器是根據(jù)發(fā)音模型,分析并提取語音信號的特征參數(shù),且只傳送能夠合成語音信息的參數(shù),不需要再現(xiàn)原語音的波形,典型的聲碼器有譜帶式、共振峰式和按線性預(yù)測分析(LPC)所組成的聲碼器等.(簡單的說,聲碼器是以發(fā)聲機制的模型為基礎(chǔ),確定了一套模擬聲帶頻譜特性的濾波系數(shù)和若干聲源參數(shù),把這一套濾波器系數(shù)和聲源參數(shù)傳送到接受機,在接收機里合成話音。)譜帶式聲碼器在發(fā)送語音信號的三種信息,其中一種信息是使語音信號通過10~20個并聯(lián)帶通濾波器,通過檢波得到信號的包絡(luò)值,再用50Hz或30Hz的幀頻傳送,另一種信息是聲帶音調(diào),通過音調(diào)控制器從語音中分析出基音頻率,并送出相應(yīng)的電壓信號,第三種信息是語音中的“濁”音、“清”音,將上述信息通過采樣、量化、編碼,合成發(fā)送出去,在接收端設(shè)置蜂音,噪聲發(fā)生器,產(chǎn)生周期脈沖,其頻率與基音相等,發(fā)生器的輸出由濁音、清音檢測控制開關(guān)的交替通斷,再被發(fā)送端送來的相應(yīng)信息調(diào)制,就得到合成的語音,其速率可壓縮到2.4kbps.共振峰聲碼器是利用語音頻帶中的共振峰信息進行編碼,它的速率可壓縮到1.2kbps,這種方法存在的問題是要準確地提取共振峰的頻率比較困難.線性預(yù)測聲碼器(LPC)是一種比較有實用價值的聲碼器,典型的方法如美國國家安全局于1975年及1986年選定的線性預(yù)測編碼(LPC—10)及改進型線性預(yù)測編碼(LPC—10E),數(shù)碼率為2.4kbps,用10階線性預(yù)測的方法提取聲道參數(shù),采用區(qū)分濁音和清音的二元激勵,清音用白噪聲和濁音用周期為基音周期的脈沖序列合成語音,用這種方法傳輸,還原出來的語音的清晰度、可懂度仍很高.LPC為線性預(yù)測分析,是聲源編碼技術(shù)之一。它供一組語音信號模擬參數(shù),該參數(shù)教精確地表征了語音信號的頻率幅度。線性預(yù)測由過去的樣本值來預(yù)測或估計當(dāng)前信號的結(jié)束值,該值為線性預(yù)測值。線性預(yù)測誤差是信號值與線性預(yù)測值之差。設(shè)計一個預(yù)測誤差濾波器,使得在某個預(yù)定的準則條件下誤差最小,這個過程稱為線性預(yù)測分析(LPC)。LPC模型中的所有模型參數(shù)都必須隨時間不斷修正,對于不同的音素(如聲母、韻母可分為輔音、單元音、復(fù)元音、復(fù)鼻尾音等)控制參數(shù)時刻的選取也不同。采用這種編碼技術(shù)可實現(xiàn)低速率語音編碼,比特率可壓縮到2Kbit/s∽4.8Kbit/S,甚至更低,但語音質(zhì)量(MOS為3分)只能達到中等,往往清晰度可以而自然度沒有,很難辨認講話人是誰,其次是復(fù)雜度比較高。§6.1.3混合編碼混合編碼是近年來出現(xiàn)的一種新的編碼方法,這種方法在保留參數(shù)模型技術(shù)精華的基礎(chǔ)上,應(yīng)用波形編碼準則去優(yōu)化激勵信號,從而在4.8~9.6kbps的數(shù)碼率上獲得了較高質(zhì)量的合成語音(簡而言之,混合編碼就是將波形編碼和參量編碼組合起來,保留了聲碼器的濾波,但改善了”激勵”參數(shù)的信息,克服了原有波形編碼和參量編碼的低速率,在4∽16Kbit/s速率上能夠得到高質(zhì)量(MOS)的合成語音),其代表是一類稱之為“按分析合成”(ABS)的方法,采用聽覺加權(quán)技術(shù),在閉環(huán)的基礎(chǔ)上尋找主觀意義上失真最小的激勵矢量.由于采用的激勵信號模型不同,這類方法派生出多種新的編碼方法,都能在9.6kbps碼率上獲得較高的話音質(zhì)量.典型的方法有剩余激勵線性預(yù)測編碼(RELP),多脈沖激勵線性預(yù)測編碼(MPC),碼激勵線性預(yù)測編碼(CELP).MPC采用數(shù)目有限,非均勻間隔的沖激序列作為激勵,在RELP中信號同樣為沖激序列,但其間隔為常數(shù),所以RELP除需指明序列的起始位置外,無需對每一個脈沖位置進行描述,而MPC需用脈沖的位置與幅度來描述.CELP采用矢量量化技術(shù),將代表語音段的矢量構(gòu)成一龐大的碼本中的地址,而不是傳送N維樣值序列,再用矢量去激勵聲道.CELP能高效地壓縮數(shù)碼率,但是,建立碼本搜索碼字的運算量也比較大.多脈沖激勵線性預(yù)測編碼(MPLPC),規(guī)劃脈沖激勵線性預(yù)測編碼(KPELPC),碼本激勵線性預(yù)測編碼(CELP)等都是屬于混合編碼技術(shù)。很顯然,混合編碼是適合于數(shù)字移動通信的語音編碼技術(shù)。其中,多脈沖激勵線性預(yù)測編碼(MPLPC)就應(yīng)用在GSM系統(tǒng)中。§6.2分析GSM系統(tǒng)中的語音編碼技術(shù)—多脈沖激勵LPC為了有效利用信道帶寬,數(shù)字無線通信系統(tǒng)都依賴于語音編碼技術(shù)來去除語音中幾乎所有的冗余,來提供速率遠小于PCM的高質(zhì)量數(shù)字化語音通信。通常解決的方法是采用信源編碼技術(shù),如多脈沖激勵LPC或其規(guī)則脈沖激勵方式,以及CELP,它們以低于16kbps的比特率維持了高質(zhì)量的合成語音。多脈沖激勵LPC技術(shù)利用了合成分析原理,即在編碼器的設(shè)計中包括了譯碼器的副本。在語音編碼中,編碼過程常稱為語音分析,它功能是將語音信號轉(zhuǎn)換為低速率的數(shù)字信號;解碼過程通常稱為語音合成,其功能是將低速率的數(shù)字語音信號合成為模擬語音信號。§6.2.1多脈沖激勵LPC編碼器的組成(1)語音預(yù)測模型的合成濾波器這種濾波器由一個用來模型化語音的短期頻譜包絡(luò)的全極點(即濾波器的轉(zhuǎn)移函數(shù)只含極點)構(gòu)成。其中短期是指濾波器參量是基于語音信號的當(dāng)前樣值計算得到的。其中,語音信號的當(dāng)前值由8∽16個先前的樣值預(yù)測得到的。合成濾波器還可能包含一個用長期預(yù)測器來模型化語音頻譜的精細結(jié)構(gòu)。在這種情況下,合成濾波器的功能都是為了提供原始語音的高質(zhì)量的合成[4]。(2)產(chǎn)生激勵的激勵發(fā)生器此激勵由5∽15ms周期內(nèi)數(shù)量一定的脈沖組成。多脈沖激勵(MPE)的設(shè)計思想是:只對激勵信號的重要部分抽樣編碼,忽略其它部分抽樣,以此降低編碼比特率。(3)差錯最小化用來最優(yōu)化原始語言與合成語音之間可感知的加權(quán)錯誤。進行最小化的目的是為了最優(yōu)化激勵中采用的脈沖幅度和相位。最小化中通常采用均方差準則。§6.2.2編碼過程(1)合成濾波器的自由參數(shù)采用實際語音樣本作為輸入計算得到的。此計算是在最優(yōu)化回路之外進行的,持續(xù)時間為10∽30ms(這段時間內(nèi)語音信號被視為是靜止的)。(2)合成濾波器的最優(yōu)激勵通過最小化圖(下圖a所示)的閉環(huán)可察覺加權(quán)誤差得到。因此,語音樣本分不同幀(10∽30ms)來計算濾波參數(shù),每個幀又進一步分為子幀(5∽15ms)來最優(yōu)化激勵。量化的濾波器參數(shù)和量化的激勵構(gòu)成了發(fā)射信號。這里允許幀與幀之間的濾波器參數(shù)和量化的激勵各不相同,也允許了子幀與子幀之間的激勵各不相同,因此編碼器能夠跟蹤語音的非穩(wěn)態(tài)特性,盡管是在分批基礎(chǔ)上進行的。§6.2.3多脈沖激勵LPC譯碼器的組成譯碼器位于接收機的內(nèi)部,由兩部分組成:激勵發(fā)生器和合成濾波器(如上圖b所示),兩個部分與編碼器中的對應(yīng)部分相同。譯碼器的作用是為了利用接收信號來得到原始語音信號的合成信號,這是由譯碼激勵通過(參數(shù)設(shè)置與編碼器中一致的)合成濾波器獲得的。為了減少編譯碼器的計算復(fù)雜度,激勵的單個脈沖之間的間隔限制為一個相同值。得到的分析合成編譯器具有規(guī)則脈沖激勵。

第七章語音編碼芯片實現(xiàn)ADPCM的芯片有MC145532,全雙工,可提供速率為32kbps;實現(xiàn)CVSD有MC3417,MC3418,MC3517,MC3518.單片可調(diào)速聲碼器Q4401是具有20世紀90年代國際先進水平的VLSI單片聲碼器[14],它包括QCELP編碼器、QCELP解碼器、幀定時發(fā)生電路、輸入凈音、音調(diào)產(chǎn)生以及PCM接口電路和微處理器接口等,其中編碼器和解碼器是Q4401的核心.Q4401具有速率可調(diào)(800~9600bps),編碼延遲較小(小于50ms),語音質(zhì)量較高[5]。第八章語音編碼技術(shù)進展從目前語音編碼技術(shù)發(fā)展來看,CELP比MPLPC的復(fù)雜度更高,碼速率更低,可以在4.8kbps左右的碼速率獲得較高質(zhì)量的語音,是當(dāng)今中、低速率語音編碼的主流技術(shù)之一,在對其改善質(zhì)量,降低復(fù)雜度,減少編碼延遲等方面都提出了不少新方法,使CELP在實踐中得到廣泛應(yīng)用,許多國際標準化組織及機構(gòu)紛紛將這一編碼方案作為語音編碼標準,語音編碼今后的研究重點將逐步轉(zhuǎn)向更低速率的編碼方法.CELP類算法是目前中低速語音壓縮編碼的主流算法之一,許多國際標準化組織及機構(gòu)將這一方案納為語音編碼標準,目前已形成的標準有:美國政府標準FS1016(4.8kbpsCELP),北美數(shù)字蜂窩語音編碼IS54(8kbpsVSRLP),日本數(shù)字蜂窩語音編碼JDC(6.7kbpsCELP)等[7,9]。結(jié)束語在移動通信系統(tǒng)中,語音編碼的設(shè)計和主觀測試是相當(dāng)困難的。只有在低速率語音編碼情況下,數(shù)字調(diào)制方案才有助于提高語音業(yè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論