《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于TMS320C6201的G.723.1多通道語音編解碼的實現
基于TMS320C6201的G.723.1多通道語音編解碼的實現
林 崢 由 紅 陳 健
摘要: 介紹了一種基于TMS320C6201的ITU-T G.723.1全雙工實時多通道語音編解碼的實現。首先簡要介紹了G.723.1標準和C6201的芯片結構,然后提出了基于C語言和匯編語言的各種優化方法以降低計算量,最后給出了各個主要模塊的性能指標。該實現能夠在200MHz的C6201 DSP上實現16路語音信號的實時編解碼,完全符合ITU-T G.723.1標準的定點算法,通過了ITU-T的所有測試矢量。
Abstract:
Key words :

  摘 要: 介紹了一種基于ti" title="ti">title="TMS320C6201" title="TMS320C6201">TMS320C6201">TMS320C6201的ITU-T G.723.1" title="G.723.1">G.723.1全雙工實時多通道" title="多通道">多通道語音編解碼" title="語音編解碼">語音編解碼的實現。首先簡要介紹了G.723.1標準和C6201的芯片結構,然后提出了基于C語言和匯編語言的各種優化方法以降低計算量,最后給出了各個主要模塊的性能指標。該實現能夠在200MHz的C6201 DSP上實現16路語音信號的實時編解碼,完全符合ITU-T G.723.1標準的定點算法,通過了ITU-T的所有測試矢量。
  關鍵詞: 語音編碼 定點數字信號處理器 ITU標準


  當前,Voice over IP(VoIP)技術正在不斷普及,通過Internet的語音通信量也日漸增加。目前VoIP中使用的低碼率語音壓縮標準主要有G.723.1和G.729兩種。 隨著VoIP技術的不斷發展,要求產品的集成度與性能進一步提高,利用新一代高性能DSP芯片,實現單片DSP處理多路語音信號,是今后的發展趨勢。本文根據C6201芯片的特點,作了大量針對G.723.1標準本身的優化,降低了運算量,滿足了多路信號的實時實現。
1 G.723.1標準介紹
  G.723.1標準是ITU組織于1996年推出的一種低碼率編碼算法。主要用于對語音及其他多媒體聲音信號的壓縮,如可視電話系統、數字傳輸系統和高質語音壓縮系統等。
  G.723.1標準可在6.3kbps和5.3kbps兩種碼率下工作。其中,高碼率算法具有較高的重建語音質量,而低碼率算法的計算復雜度則較低。與一般的低碼率語音編碼算法一樣,G.723.1標準采用線性預測的合成分析法(Analysis-by-Synthesis)。對激勵信號進行量化時,高碼率算法采用多脈沖最大似然量化(MP-MLQ),而低碼率算法則采用算術碼本激勵線性預測(ACELP)。目前,G.723.1已經能在多種DSP芯片上實現,如美國TI公司的TMS320C5x、TMS320C54x和朗訊科技公司的DSP16xx等。
  G.723.1編碼器能對以8kHz采樣的話帶語音信號進行壓縮,其結構框圖見圖1(a)。從圖中可以看出,編碼器是基于線性預測合成分析法原理,其目的是最小化感知加權誤差信號。為了降低碼率,G.723.1采用了較長的幀尺寸,每幀240個樣值,即30毫秒幀長。每幀輸入信號首先通過一階高通濾波器濾除直流分量,然后將之分成四個60個樣值的子幀,每個子幀獨立進行LPC分析。為了提高LPC系數的連續性,采用了長度為180個樣值的重疊窗,即同時包含前后兩個子幀,這使算法引入60個樣值的超前時延,因此算法的總時延為37.5毫秒。LPC系數用線性譜頻率(LSF)表示,LSF參數采用預測分裂矢量量化,只對第四子幀進行。為了提高量化感知質量,高通濾波后的語音信號需通過共振峰感知加權濾波器和諧振峰噪聲整形濾波器以生成初始目標信號。前者參數由各子幀的未量化LPC系數構成,后者通過對每兩子幀進行開環基音周期估計得到,其中基音周期的范圍為18到142個樣值。LPC合成濾波器、共振峰感知加權濾波器和諧振峰噪聲整形濾波器用于系統零輸入響應計算和最佳激勵估計。G.723.1編碼器還包括一個五階基音預測器,其參數根據開環基音估計值和脈沖響應進行閉環基音搜尋得到。在進行最佳激勵估計時,需從初始目標信號中減去系統零輸入響應和基音預測器貢獻以得到最終目標信號,然后針對高低碼率分別采用MP-MLQ和ACELP方法進行量化。其中LSF參數、基音值和激勵參數需傳送給解碼器。
  解碼器首先根據得到的LSF參數重建LPC合成濾波器,然后根據基音值和激勵參數得到自適應碼本激勵信號和固定碼本激勵信號。為了提高重建語音的主觀質量,解碼器還包括一個后濾波器,后濾波器由共振峰和基音后濾波器組成。激勵信號依次通過基音后濾波器、合成濾波器和共振峰后濾波器合成重建語音,其結構框圖見圖1(b)。


2 TMS320C6201芯片結構簡介
  TMS320C6201是一種32位的定點DSP,工作頻率最高達200MHz。它有兩組運算單元,每組4個,共8個。除M單元只能作乘法外,其他單元都可以靈活使用,如D單元可以做Load、Store和加減操作,S單元可以進行移位和加減。C6201有32個通用寄存器,分為A、B兩側。兩側的寄存器有交叉通路,同一指令可以同時訪問雙側的寄存器。C6201采用了超長指令字結構,一次最多可以同時執行8條指令(每個單元一條)。它有11級流水,所有的指令都是精簡指令。C6201允許使用緩存(Cache)模式,可以運行大型程序而不降低速度。圖2是C6201的結構。


3 標準的實現
  用C6201實現G.723.1標準的最大優勢在于它極強的并行處理能力,用一塊DSP可以實現多路語音的壓縮,大大簡化了硬件的設計。C6201是TI公司推出的第一種支持C編譯器的DSP芯片。通常,C編譯器能完成整個工作的70%,而30%的進一步優化必須通過手寫匯編來實現,所以對整個程序的優化分為C語言級和匯編語言級兩部分。
3.1 C語言級的優化
3.1.1 循環展開(loop-unrolling)

  使用具有并行能力的DSP開發軟件時,一個重要的思想就是充分利用DSP的字長和數目眾多的運算單元,盡量把循環體展開。通過增加每次循環中執行的指令數來減少總的循環次數,可使得在同樣的時鐘周期內能運行更多的指令,提高了循環的效率。
3.1.2 提高寄存器的利用率
  DSP芯片內部的運算單元運行效率非常高,但如果寄存器和數據總線之間的數據交換頻繁,將使DSP的執行效率大打折扣。因為DSP在進行內存操作時,往往需要若干周期的延遲,如Load指令要有4個周期的延遲,Store指令需要2個周期的延遲。為了減少耗時的內存操作,可以在程序進入循環體之前,將要頻繁使用的數據預先放入寄存器,然后反復調用,實踐證明這種方法可以提高一部分效率。
3.1.3 使用內在函數(Intrinsic)
  內在函數是在某些C6201DSP的匯編指令前加上“_”構成、它可以方便地實現某些需若干C語句才能實現的功能。它是一種非常簡便高效的優化方法,它的調用格式和普通C函數一樣,但在編譯時編譯器會自動將Intrinsic用對應的匯編指令替代。C6201指令集中絕大多數的運算邏輯指令都可以這樣使用,比如飽和絕對值、飽和加、飽和減、飽和乘、兩個字中的對應半字同時加或同時減、兩個字中的對應半字同時乘或交叉乘、歸一化及位操作等。經過此步優化后,大部分循環體都可以生成較為有效的流水內核(piplined kernel)。用Intrinsic替代G.723.1原先的C代碼,運算量下降為原來的1/10。
3.1.4 對算法的冗余部分合理精簡
  經過檢查,發現ITU-T G.723.1的C代碼存在冗余部分。象6.3k碼率的MP-MLQ搜索模塊中,只需要用到偶數位置的脈沖響應的自相關,所以對奇數位置的脈沖響應自相關計算可以省略。
  另外,在G.723.1標準中存在大量的10階FIR和10階IIR濾波器運算,如編碼部分的感知加權、零輸入響應、解碼部分綜合濾波器和后濾波等,FIR和IIR的通用形式可以表示為:
  
  每次循環,FIR濾波器內存要用新的輸入值更新,IIR濾波器內存要用新的輸出值更新,使用按標準提供的算法,要專門用一個10階循環更新內存。如果用一個10單位大小的循環緩存區,每次用新值覆蓋最老的樣值,動態調整循環緩存區的頭指針,可以節省原先用于內存更新的cycle。
3.2 匯編級優化
  由于C編譯器只能完成70%的工作、且對于復雜的循環,C編譯器無法生成高效率的代碼,所以對運算量大的模塊只能用手寫匯編。
3.2.1 字長優化
  C6201的字長為32位,它支持按字節、半字、字存取。對于16位的數組,當它在內存中連續排列時,用32位讀寫指令LDW或STW替代16位讀寫指令LDH或STH,循環次數可減少一半。另外,C6201的匯編指令支持兩個32位寄存器的高16位和低16位之間互乘,結果分別放到不同的寄存器中,互不影響。具體指令為SMPY(L×L)、SMPYH(H×H)、SMPYHL(H×L)和SMPYLH(L×H)。通過字長優化,可以大大提高程序的運行效率。必須注意的是,在使用字長優化時,數組在內存中的位置必須對齊32位邊界。
3.2.2 對外循環的優化
  C6201的C編譯器對多重循環的最內層一般能較好地優化到一句到兩句,但對外循環的優化效率則差很多。手寫匯編時,可以先將內循環展開,再把外循環的指令并入其中,可以減少所耗費的cycle數。
  C6201的循環一般分前導(Prolog)、內核(Kernel)及排空(Epilog)三部分。代碼的并行程度從Prolog開始不斷提高,Kernel內的并行程度最高,Epilog與Prolog相反,并行性逐漸降低。在多重循環中,如果盡量把內循環前導部分的指令與填入排空部分未用的單元,一起執行,可以在執行本次循環的排空語句的同時執行下次循環的前導語句。這樣可不多花cycle而提高整個循環的效率。
4 實現結果
  經過C語言級和匯編級的多種優化,最后實現了一路G.723.1的編解碼需要花費10.6MCPS,整個代碼的程序空間為208K byte(程序中包括了部分c6201的庫函數),數據空間為8K byte,碼本大小20k byte,多通道的上下文數據為1.48K byte。200MHz的C6201每秒可以實時編解碼16路語音信號。所有代碼全部通過了ITU-T測試矢量的測試。表1是各主要模塊的運算量。


  本文提出的利用C6201 DSP進行ITU-T G.723.1全雙工、實時多通道語音編解碼的實現。該實現可以在IP電話、視頻會議中得到廣泛應用。
參考文獻
1 Dual Rate Speech Coder for Multimedia Communications Transmitting at 5.3&6.3 kbit/s.ITU-T Recommendation G.723.1、 Helsinki、 March 1996
2 TMS320C62x/C67x Prorammer’s Guide.Texas Instru-ments Inc、 1998
3 TMS320C62x/C67x CPU and Instruction Set Reference Guide.Texas Instruments Inc、 1998
4 TMS320C6000 Optimizing C Compiler User′s Guide.Texas Instruments Inc、 1999

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 成年午夜 | 精品一区二区三区视频 | 亚洲欧洲日产国码二区首页 | 一级视频网站 | 日本免费毛片在线高清看 | 成年人黄色免费网站 | 亚洲第一狼人区 | 欧美一级黄色毛片 | 俄罗斯黄色毛片 | 精品国语_高清国语自产 | 日本一区二区三区免费视频 | 久久精品午夜视频 | 久久成人免费视频 | 国产一区二区三区免费视频 | 成人www视频网站免费观看 | 国产超清在线观看 | 欧美大片一区二区三区 | 国产原创在线视频 | 久久国产精品-久久精品 | 草草影院永久在线观看 | 男女牲高爱潮免费视频男女 | 男人操美女| 精品国产91久久久久久久 | 久久免费视频在线观看 | 久久精品免费一区二区视 | 国产成人v爽在线免播放观看 | 特级aa一级欧美毛片 | 特别福利视频在线观看 | 亚州不卡 | 亚洲欧美日韩精品久久久 | 日韩偷拍自拍 | 久久不见久久见免费影院 | 台湾一级特黄精品大片 | 在线视频 一区二区 | 一级成人毛片免费观看 | 酒色影院 | 女人张腿让男桶免费视频网站 | 草久视频在线 | 第一区免费在线观看 | 日本又黄又爽又免费 | 女人抠逼视频 |