《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 高性能語音撥號器的設計與實現

高性能語音撥號器的設計與實現

2008-12-12
作者:王鵬浩 朱 璇 張京濤

  摘 要:數字信號處理器" title="數字信號處理器">數字信號處理器ADSP2186L為核心,通過單片機進行系統控制,設計語音撥號器,實現語音控制的自動撥號功能。
  關鍵詞: DSP 語音識別 雙音多頻


  隨著語音信號處理理論以及超大規模集成電路的發展,語音識別、語音編碼以及語音合成技術逐步走向實用化。國外已有相應的應用電子產品問世(如美國Sensory公司的產品),國內市場上也出現了具備語音識別功能的手機(如PHILIPS,SAMSUNG等公司的產品)。本文介紹的基于ADSP2186L的語音撥號器集語音識別、語音編解碼、語音提示、語音合成以及雙音多頻撥號功能于一體,與現有產品相比具有容量大,識別率高,使用方便的優點。
1 系統功能
  ·可存儲200個用戶詞條,800個電話號碼。
  · 支持語音查詢方式,用戶只需口述詞條,即可獲得相應的電話號碼。同時兼容手動查詢方式。
  · 具有方便的編輯功能(增加、刪除、修改用戶記錄)。
  · 具有雙音多頻撥號功能,使用普通電話機便可實現自動撥號。
2 系統整體模塊設計
  整個系統可分為信號處理單元,系統控制單元和用戶界面單元共三個功能模塊。
2.1 信號處理單元
  本單元包括數字信號處理器,編解碼器" title="編解碼器">編解碼器和存儲器。
  作為系統語音信號處理核心的ADSP2186L是ANALOG DEVICES公司生產的低電壓16位定點數字信號處理器。該芯片具有以下特點:
  · 運算速度33MIPS;
  · 片內含40K Byte RAM,分為16K Byte的程序RAM及24K Byte的數據RAM;
  · 兩路獨立可編程全雙工串行通信接口,支持A律/μ律的硬件語音解壓擴,支持自動緩沖區操作;
  · 4M Byte的外部尋址空間;
  · 支持內外存之間的DMA操作;
  · 13個可編程的I/O" title="I/O">I/O口。
  DSP在系統中主要完成語音信號的特征提取,端點檢測和模板匹配,同時負責用戶記錄的管理。
  與ADSP2186L配套使用的是ANALOG DEVICES公司最新生產的低電壓16位編解碼器AD73311L,該芯片通過設置相應的寄存器可實現8~64kHz的多種采樣頻率,具有可編程的輸入輸出增益控制。該芯片在系統中完成語音信號的A/D,D/A轉換。
  系統存儲器選用SILICON STORAGE TECHNOLOGY公司生產的8M位快閃存儲器(Flash Memory)SST39VF080Q,主要存儲兩部分內容,DSP的應用程序和用戶的語音記錄" title="語音記錄">語音記錄數據。該芯片具有軟件寫保護功能,可以防止應用程序的意外更改,全片分為256個4KByte的扇區,適于語音記錄的存取。
2.2 系統控制單元
  選用SAMSUNG公司生產的4位單片機KS57C2308,該芯片主要負責系統整體流程控制以及用戶界面控制。KS57C2308具有較寬的工作電壓,同時提供段式液晶的驅動,具有較強的I/O操作能力,適合應用于要求多個I/O口以及液晶顯示的工作環境。采用KS57C2308可以簡化系統,并使系統具有較好的外部接口擴展能力。
2.3 用戶界面單元
  包括鍵盤、液晶、駐極話筒和揚聲器四部分。
  系統硬件模塊結構如圖1所示。


2.4數字信號處理器與編解碼器之間的通信
  數字信號處理器ADSP2186L與編解碼器之間的通信通過獨立的串行口完成。具體連線如圖2所示,信號說明如表1所示。

  


  由于AD73311L采取自接外部晶振,通過內部設置分頻寄存器確定采樣率的工作方式,ADSP2186L的SCLK、TFS,RFS均設為外部輸入。采用DSP的串口時序進行通信。
2.5 數字信號處理其余單片機間的通信
  ADSP2186L與單片機的接口與此類似,區別在于ADSP2186L的SCLK、TFS、RFS均設為內部輸出。單片機通過通用的I/O口模擬DSP的串口時序,通信協議采用自定義的數據包格式,速度快,可靠性高。單片機同時控制DSP的復位引腳,進一步保證系統工作的可靠性。
2.6 數字信號處理器與外部存儲器的接口
  DSP與外部存儲器之間通過地址和數據總線連接,利用DSP的BMS、WR、RD引腳實現對外部存儲器存的片選及讀寫控制。系統復位時,DSP由外部存儲器中自動加載程序,系統運行過程中的數據通過DMA方式進行傳輸。
  單片機通過專用的液晶驅動引腳控制液晶,通過通用的I/O引腳完成鍵盤掃描。
3 系統軟件實現
  系統軟件采取模塊化設計,根據功能將DSP的程序分為10個基本模塊。
  (1)系統初始化
  初始化內容包括算法參數,狀態變量,端口設置。
  (2)通信接口
  主要功能是接收單片機指令,并在完成相應的操作序列后回送操作結果。
  (3)語音記錄
  使用DSP的自動緩沖區技術,在用戶口述詞條的過程中,實時提取用于識別和回放的特征參數" title="特征參數">特征參數,利用高性能的端點檢測算法去除靜音段及噪聲段,將實際語音段的特征數據保存在數據RAM中。
  (4)語音識別
  使用模式識別方法將數據RAM中的特征參數與外部存儲器中保存的現有用戶記錄相比較,找出最相近的記錄作為識別結果,獲得相應的記錄指針。
  (5)語音提示
  利用預先編碼的數據合成語音,用于對用戶的相應操作進行提示,方便用戶使用,減少誤操作的可能性。編解碼采用多脈沖線性預測編碼(Multi-Pulse Linear Predict Code)算法,能以較低的碼率獲得較高質量的合成語音。
  (6)語音回放
  利用“語音記錄”過程中提取的回放特征參數合成語音,用于用戶檢驗記錄結果或識別結果。根據參數提取的實時性要求,此處采取速度快,合成質量好的編解碼算法。
  (7)增加記錄
  將“語音記錄”中提取的特征參數連同相應的用戶電話號碼存入外部存儲器。同時修改記錄指針。
  (8)修改記錄
  保持記錄的特征參數不變,只修改電話號碼。
  (9)刪除記錄
  刪除整個用戶記錄,包括特征參數和電話號碼,同時清除相應指針。
  (10)雙音多頻撥號
  利用級數展開的方法合成正弦信號,經編解碼器進行D/A轉換后至揚聲器輸出,實現自動撥號功能。
  單片機利用鍵盤接收用戶指令,通過功能模塊的不同組合方式,可以形成多種控制流程,以適應不同應用場合的需要。
  系統軟件框圖如圖3所示。


4 系統性能測試
  本系統具有較高的識別率,對于普通詞條,識別率超過99%,對于發音相近的易混淆詞條,如“李平,李寧,李丁”,識別率也可達到90%以上。同時,本系統具有良好的用戶界面,用戶在語音提示下完成相應操作,方便快捷。
  本系統具備語音撥號器的基本功能,由于它的軟件和硬件設計都具有模塊化特性,很容易改造成適用于其他應用場合的語音控制系統。因此,本系統具有較為廣泛的應用前景。
參考文獻
1 楊行峻,遲惠生等.語音信號數字處理.北京:電子工業
出版社,1995
2 ADSP-2100 FAMILY USER'S MANUAL、 ANALOG DE-VICES、 1995
3 KS57C2308 USER'S MANUAL、 SAMSUNG ELECTRON-ICS、 1998
4 FLASH MEMORY DATA BOOK、 SILICON STORAGE TECHNOLOGY、 1999

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 亚洲综合精品一二三区在线 | 精品一区二区三区的国产在线观看 | 国产在线拍揄自揄视精品不卡 | 国产日韩一区二区三区在线观看 | 作爱视频在线免费观看 | 欧美大尺码毛片 | 午夜毛片免费观看视频 | 精品国产呦系列在线看 | 伊人久久免费 | 精品一区二区三区亚洲 | 久久久美女视频 | 亚洲欧美视频一级 | 国产精品自拍第一页 | 成人精品视频网站 | 亚洲日本va午夜中文字幕一区 | 国产综合亚洲专区在线 | 日本无遮 | 99在线国产 | 国产免费专区 | 一级色黄| 中文在线日韩 | 一区二区三区视频 | 精品国产三级a∨在线观看 精品国产三级a在线观看 | 一级毛片免费观看不卡的 | 足恋玩丝袜脚视频免费网站 | 久久精品综合 | 亚洲国产精品久久久久秋霞不卡 | 国产中文字幕在线播放 | 国产一级片毛片 | 成人欧美精品一区二区不卡 | 国产成人在线播放视频 | 日韩毛片基地 | 国内精品久久久久久久aa护士 | 精品久久久久不卡无毒 | 国产美女精品视频 | 琪琪午夜伦埋大全影院 | 最新亚洲国产有精品 | 成年女人永久免费观看片 | 中文字幕无线精品乱码一区 | 怡红院视频在线观看 | 碰碰碰免费公开在线视频 |