單片機開發(fā)
單片機語音處理技術
單片機語音處理技術應用
多媒體技術是現(xiàn)代計算機應用技術中極其活躍的一門新興技術,音像處理是多媒體技術的核心研究對象,語音處理是聲音處理技術中極為重要的實用技術。語音處理技術的基礎是語音學和數(shù)字信號處理,它包括語音分析技術、語音存儲技術、語音識別技術和語音合成(重現(xiàn))技術。本文以凌陽SPCE061A為例,對單片機語音處理技術方面的原理與應用進行了探討。
一、音頻處理
計算機處理音頻主要采用幾項技術:采樣與量化技術、音頻保存技術、音頻壓縮編碼技術、音頻重現(xiàn)與辨識技術。采樣與量化是將自然界中聲音按一定要求采集到計算機中,是聲音處理技術的基礎??陕犚纛l的頻率在20Hz~20kHz范圍內,語音的頻率一般在60Hz~500Hz范圍內。
音頻可分為波形聲音、語音和音樂三種。與任何聲音一樣,語音也表現(xiàn)為波形聲音,但波形聲音表示不出語言、語音的內涵。語音是對講話聲音的一次抽象,是語言的載體,是人類社會特有的一種信息系統(tǒng)。音樂是特殊的聲音,是聲音的一個微弱子集,是規(guī)范化符號化了的聲音。但音樂不能對所有的聲音進行符號化。樂譜是符號化聲音的符號組,不同的組合表示比單個號更復雜的聲音信息。
計算機處理音頻時首先要將模擬的(連續(xù)的)聲音波形數(shù)字化(離散化),這要通過A/D轉換器來實現(xiàn),轉換后的音頻稱為數(shù)字音頻,它的質量取決于A/D轉換器的轉換速率和分辨率,速率越高表征單位時間內采集到的數(shù)據(jù)越多,分辨率越高表征采集到的數(shù)據(jù)精度越高,所以音頻處理中對音頻的采樣頻率和量化位數(shù)是兩個重要參數(shù)。采集到的音頻信號由音頻文件保存。音頻文件分為兩類:聲音文件和MIDI文件。
二、單片機語音處理技術
單片機語音處理方面,通常解決的方案采用兩個途徑:一是對單片機本身進行擴展設計,將語音處理功能模塊直接置于單片機內;二是借助于專門的語音處理芯片擴展單片機的功能。由于專門的語音處理芯片系列較多且功能單一,實現(xiàn)一個完整的系統(tǒng)需要增加很多的外圍器件,因而在使用上不很方便,所以比較這兩種方案,第一種具有明顯的優(yōu)勢,但作為通用處理器而言,這種方案是不妥當?shù)摹?br/>
專為語音識別和語音處理應用領域設計的芯片需有一顆高速DSP核心處理器承擔控制和運算任務,還需適量的片內集成ROM/RAM存儲器用來存儲應用程序、驅動程序、各種數(shù)據(jù)和語音識別、語音壓縮算法及算法所用常數(shù)表等,這增大了芯片設計與制造的成本。由于單片機語音處理芯片在片內集成的ROM/RAM存儲器不可能很大,因此單片機不適合用于大規(guī)模語音處理系統(tǒng)。
三、凌陽SPCE061A單片機語音處理技術
3.1凌陽SPCE061A單片機
凌陽SPCE061A是一款16位μ’nSP結構的微控制器。該芯片帶有硬件乘法器,能夠實現(xiàn)乘法運算、內積運算等復雜的運算。凌陽SPCE061A單片機設計先進,特點突出,易學易用,體現(xiàn)了現(xiàn)代微控制器工業(yè)發(fā)展的新趨勢。
3.2凌陽SPCE061A單片機語音處理的實現(xiàn)
凌陽SPCE061A將語音處理相關各功能做成函數(shù)模塊,通過API調用來實現(xiàn)。這些函數(shù)分為兩類:用于音頻資料播放的凌陽音頻編碼(SACM)類和用于辨識語音的語音識別(BSR)類。
對輸入生成的WAVE文件按不同的壓縮算法壓縮成SACM_A2000或SACM_S480等相應語音資料后,就可利用SACM-LIB庫對這些資料進行處理。該庫將A/D、編碼、解碼、存儲及D/A做成相應的模塊,每個模塊都有其應用程序接口API函數(shù),調用對應函數(shù)即可實現(xiàn)各自功能。
如針對特定人語音辨識,SACM-LIB庫中提供了包括C語言和匯編語言兩種格式定義的API函數(shù),常用語音辨識API函數(shù)有:
(1)SRAM初始化函數(shù)int BSR-DeleteSD-Group(int);(2)訓練函數(shù)int BSR-Train(int CommandID,int TrainMode);(3)識別初始化函數(shù)int BSR-InitRecognizer(int AudioSource);(4)獲取識別結果函數(shù)int BSR-GetResult(void);(5)停止識別函數(shù)void BSR-StopRecognizer(void);(6)識別中斷程序-BSR-FIQ-Routine;
配合語音壓縮及播放的相關API函數(shù),即可構成一個完整的語音應用系統(tǒng)。
總結
語音處理技術對下一代多模式交互人機界面設計技術有重要影響,隨著消費類電子產品中對于高性能、高穩(wěn)定性的語音接口需求的快速增加,單片機及嵌入式語音處理技術在快速發(fā)展。然而,語音處理技術解決方案目前還普遍存在一些問題,隨著軟硬件技術的進一步研究,這些問題一定會在不久的將來得到合理解決,語音處理技術將為計算機的深入應用帶來更加廣闊的空間。
以上就是我們深圳市組創(chuàng)微電子有限公司為您介紹的單片機語音處理技術應用。我們有豐富的智能電子產品定制開發(fā)經(jīng)驗,可以盡快評估開發(fā)周期與IC價格,也可以核算PCBA報價。我們是松翰單片機代理商、應廣單片機代理商,出售并開發(fā)sonix與應廣的MCU與語音IC方案。我們代理并開發(fā)杰理、安凱、全志、realtek等系列的IC與方案,還開發(fā)BLE藍牙IC、雙模藍牙模塊、wifi模塊、物聯(lián)網(wǎng)模塊。我們的擁有硬件設計與軟件開發(fā)能力。涵蓋了電路設計、PCB設計、單片機開發(fā)、軟件定制開發(fā)、APP定制開發(fā)、微信公眾號開發(fā)、語音識別技術、藍牙開發(fā)、wifi技術等。還可以承接智能電子產品研發(fā)、家用電器方案設計、美容儀器開發(fā)、物聯(lián)網(wǎng)應用開發(fā)、智能家居方案設計、TWS耳機開發(fā)、藍牙耳機音箱開發(fā)、兒童玩具方案開發(fā)、電子教育產品研發(fā)。
- 返回頂部