版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p><b> 摘要</b></p><p> 語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)和語音學(xué)知識(shí)對(duì)語音信號(hào)進(jìn)行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。</p><p> 數(shù)字信號(hào)處理(DigitalSignalProcessing,簡(jiǎn)稱DSP)是利用計(jì)算
2、機(jī)或?qū)S锰幚碓O(shè)備,以數(shù)字形式對(duì)信號(hào)進(jìn)行采集、變換、濾波、估值、增強(qiáng)、壓縮、識(shí)別等處理,以得到符合人們需要的信號(hào)形式。</p><p> Matlab語言是一種數(shù)據(jù)分析和處理功能十分強(qiáng)大的計(jì)算機(jī)應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強(qiáng)大的矩陣運(yùn)算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時(shí)域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號(hào)處理與分析工具箱為語音信號(hào)分析提供了十分豐富的功能函數(shù),利用
3、這些功能函數(shù)可以快捷而又方便地完成語音信號(hào)的處理和分析以及信號(hào)的可視化,使人機(jī)交互更加便捷。信號(hào)處理是Matlab重要應(yīng)用的領(lǐng)域之一。</p><p> 本設(shè)計(jì)針對(duì)現(xiàn)在大部分語音處理軟件內(nèi)容繁多、操作不便等問題,采用MATLAB7.0綜合運(yùn)用GUI界面設(shè)計(jì)、各種函數(shù)調(diào)用等來實(shí)現(xiàn)語音信號(hào)的變頻、傅里葉變換及濾波,程序界面簡(jiǎn)練,操作簡(jiǎn)便,具有一定的實(shí)際應(yīng)用意義。</p><p> 關(guān)鍵字:
4、Matlab,語音信號(hào),傅里葉變換,信號(hào)處理</p><p><b> 1 緒 論</b></p><p><b> 課題的背景與意義</b></p><p> 通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息的形式。語言是人類持有的功能。聲音是人類常用的工具,是相互傳遞信息的最主要的手段。因此
5、,語音信號(hào)是人們構(gòu)成思想疏通和感情交流的最主要的途徑。并且,由于語言和語音與人的智力活動(dòng)密切相關(guān),與社會(huì)文化和進(jìn)步緊密相連,所以它具有最大的信息容量和最高的智能水平。現(xiàn)在,人類已開始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究語音信號(hào),使人們能更加有效地產(chǎn)生、傳輸、存儲(chǔ)、獲取和應(yīng)用語音信息,這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義。</p><p> 讓計(jì)算機(jī)能聽懂人類的語言,是人類自計(jì)算機(jī)誕生以來夢(mèng)寐以求的想法。隨著計(jì)算機(jī)
6、越來越向便攜化方向發(fā)展,隨著計(jì)算環(huán)境的日趨復(fù)雜化,人們?cè)絹碓狡惹幸髷[脫鍵盤的束縛而代之以語音輸人這樣便于使用的、自然的、人性化的輸人方式。作為高科技應(yīng)用領(lǐng)域的研究熱點(diǎn),語音信號(hào)采集與分析從理論的研究到產(chǎn)品的開發(fā)已經(jīng)走過了幾十個(gè)春秋并且取得了長遠(yuǎn)的進(jìn)步。它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理。工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動(dòng)撥號(hào)、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實(shí)際應(yīng)用領(lǐng)
7、域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用程序的用戶界面??梢?,語音信號(hào)采集與分析的研究將是一項(xiàng)極具市場(chǎng)價(jià)值和挑戰(zhàn)性的工作。我們今天進(jìn)行這一領(lǐng)域的研究與開拓就是要讓語音信號(hào)處理技術(shù)走入人們的日常生活當(dāng)中,并不斷朝更高目標(biāo)而努力。</p><p> 語音信號(hào)采集與分析之所以能夠那樣長期地、深深地吸引廣大科學(xué)工作者去不斷地對(duì)其進(jìn)行研究和探討,除了它的實(shí)用性之外,另一個(gè)重要原因是,它始終與當(dāng)時(shí)信息科學(xué)中最活躍的前沿學(xué)
8、科保持密切的聯(lián)系,并且一起發(fā)展。語音信號(hào)采集與分析是以語音語言學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一門涉及面很廣的綜合性學(xué)科,與心理、生理學(xué)、計(jì)算機(jī)科學(xué)、通信與信息科學(xué)以及模式識(shí)別和人工智能等學(xué)科都有著非常密切的關(guān)系。對(duì)語音信號(hào)采集與分析的研究一直是數(shù)字信號(hào)處理技術(shù)發(fā)展的重要推動(dòng)力量。因?yàn)樵S多處理的新方法的提出,首先是在語音信號(hào)處理中獲得成功,然后再推廣到其他領(lǐng)域。</p><p><b> 國內(nèi)外研究現(xiàn)狀
9、</b></p><p> 語音信號(hào)的采集與分析作為一個(gè)重要的研究領(lǐng)域,已經(jīng)有很長的研究歷史。但是它的快速發(fā)展可以說是從1940年前后Dudley的聲碼器(vocoder)和potter等人的可見語音(Visible Speech)開始的。1952年貝爾(Bell)實(shí)驗(yàn)室的Davis等人首次研制成功能識(shí)別十個(gè)英語數(shù)字的實(shí)驗(yàn)裝置。1956年Olson和Belar等人采用8個(gè)帶通濾波器組提取頻譜參數(shù)作為
10、語音的特征,研制成功一臺(tái)簡(jiǎn)單的語音打字機(jī)。20世紀(jì)60年代初由于Faut和Steven的努力,奠定了語音生成理論的基礎(chǔ),在此基礎(chǔ)上語音合成的研究得到了扎實(shí)的進(jìn)展。20世紀(jì)60年代中期形成的一系列數(shù)字信號(hào)處理方法和技術(shù),如數(shù)字濾波器、快速博里葉變換(FFT)等成為語音信號(hào)數(shù)字處理的理論和技術(shù)基礎(chǔ)。在方法上,隨著電子計(jì)算機(jī)的發(fā)展,以往的以硬件為中心的研究逐漸轉(zhuǎn)化為以軟件為主的處理研究。然而,在語音識(shí)別領(lǐng)域內(nèi),初期有幾種語音打字機(jī)的研究也很活
11、躍,但后來已全部停了下來,這說明了當(dāng)時(shí)人們對(duì)話音識(shí)別難度的認(rèn)識(shí)得到了加深。所以1969年美國貝爾研究所的Pierce感嘆地說“語音識(shí)別向何處去?”。</p><p> 到了1970年,好似反駁Pierce的批評(píng),單詞識(shí)別裝置開始了實(shí)用化階段,其后實(shí)用化的進(jìn)程進(jìn)一步高漲,實(shí)用機(jī)的生產(chǎn)銷售也上了軌道。此外社會(huì)上所宣傳的聲紋(Voice Print)識(shí)別,即說話人識(shí)別的研究也扎扎實(shí)實(shí)地開展起來,并很快達(dá)到了實(shí)用化的階
12、段。到了1971年,以美國ARPA(American Research Projects Agency)為主導(dǎo)的“語音理解系統(tǒng)”的研究計(jì)劃也開始起步。這個(gè)研究計(jì)劃不僅在美國園內(nèi),而且對(duì)世界各國都產(chǎn)生了很大的影響,它促進(jìn)了連續(xù)語音識(shí)別研究的興起。歷時(shí)五年的龐大的ARPA研究計(jì)劃,雖然在語音理解、語言統(tǒng)計(jì)模型等方面的研究積累了一些經(jīng)驗(yàn),取得了許多成果,但沒能達(dá)到巨大投資應(yīng)得的成果,在1976年停了下來,進(jìn)入了深刻的反省階段。但是,在整個(gè)20
13、世紀(jì)70年代還是有幾項(xiàng)研究成果對(duì)語音信號(hào)處理技術(shù)的進(jìn)步和發(fā)展產(chǎn)生了重大的影響。這就是20世紀(jì)70年代初由板倉(Itakura)提出的動(dòng)態(tài)時(shí)間規(guī)整(DTW)技術(shù),使語音識(shí)別研究在匹配算法方面開辟了新思路;20世紀(jì)70年代中期線性預(yù)測(cè)技術(shù)(LPC)被用于語音信號(hào)處理,此后隱馬爾可夫模型法(HNMM)也獲得初步成功,該</p><p> 20世紀(jì)80年代,由于矢量量化、隱馬爾可夫模型和人工神經(jīng)網(wǎng)絡(luò)(ANN)等相繼被應(yīng)
14、用于語音信號(hào)處理,并經(jīng)過不斷改進(jìn)與完善,使得語音信號(hào)處理技術(shù)產(chǎn)生了突破性的進(jìn)展。其中,隱馬爾可夫模型作為語音信號(hào)的一種統(tǒng)計(jì)模型,在語音信號(hào)處理的各個(gè)領(lǐng)域中獲得了廣泛的應(yīng)用。其理論基礎(chǔ)是1970年前后,由Baum等人建立起來的,隨后,由美國卡內(nèi)基梅隆大學(xué)(CMU)的Baker和美國IBM公司的Jelinek等人將其應(yīng)用到語音識(shí)別中。由于美國貝爾實(shí)驗(yàn)室的Babiner等人在20世紀(jì)80年代中期,對(duì)隱馬爾可夫模型深人淺出的介紹,才使世界各國從
15、事語音信號(hào)處理的研究人員了解和熟悉,進(jìn)而成為一個(gè)公認(rèn)的研究熱點(diǎn),也是目前語音識(shí)別等的主流研究途徑。</p><p> 進(jìn)入20世紀(jì)90年代以來,語音信號(hào)采集與分析在實(shí)用化方面取得了許多實(shí)質(zhì)性的研究進(jìn)展。其中,語音識(shí)別逐漸由實(shí)驗(yàn)室走向?qū)嵱没?。一方面,?duì)聲學(xué)語音學(xué)統(tǒng)計(jì)模型的研究逐漸深入,魯棒的語音識(shí)別、基于語音段的建模方法及隱馬爾可夫模型與人工神經(jīng)網(wǎng)絡(luò)的結(jié)合成為研究的熱點(diǎn)。另一方面,為了語音識(shí)別實(shí)用化的需要,講者自
16、適應(yīng)、聽覺模型、快速搜索識(shí)別算法以及進(jìn)一步的語言模型的研究等課題倍受關(guān)注。</p><p> 數(shù)字信號(hào)處理(DSP)簡(jiǎn)介</p><p> 數(shù)字信號(hào)處理(DigitalSignalProcessing,簡(jiǎn)稱DSP)是一門涉及許多學(xué)科而又廣泛應(yīng)用于許多領(lǐng)域的新興學(xué)科。20世紀(jì)60年代以來,隨著計(jì)算機(jī)和信息技術(shù)的飛速發(fā)展,數(shù)字信號(hào)處理技術(shù)應(yīng)運(yùn)而生并得到迅速的發(fā)展。在過去的二十多年時(shí)間里,數(shù)
17、字信號(hào)處理已經(jīng)在通信等領(lǐng)域得到極為廣泛的應(yīng)用。</p><p> 數(shù)字信號(hào)處理是利用計(jì)算機(jī)或?qū)S锰幚碓O(shè)備,以數(shù)字形式對(duì)信號(hào)進(jìn)行采集、變換、濾波、估值、增強(qiáng)、壓縮、識(shí)別等處理,以得到符合人們需要的信號(hào)形式。</p><p> 數(shù)字信號(hào)處理是圍繞著數(shù)字信號(hào)處理的理論、實(shí)現(xiàn)和應(yīng)用等幾個(gè)方面發(fā)展起來的。數(shù)字信號(hào)處理在理論上的發(fā)展推動(dòng)了數(shù)字信號(hào)處理應(yīng)用的發(fā)展。反過來,數(shù)字信號(hào)處理的應(yīng)用又促進(jìn)了數(shù)
18、字信號(hào)處理理論的提高。而數(shù)字信號(hào)處理的實(shí)現(xiàn)則是理論和應(yīng)用之間的橋梁。</p><p> 數(shù)字信號(hào)處理是以眾多學(xué)科為理論基礎(chǔ)的,它所涉及的范圍極其廣泛。例如,在數(shù)學(xué)領(lǐng)域,微積分、概率統(tǒng)計(jì)、隨機(jī)過程、數(shù)值分析等都是數(shù)字信號(hào)處理的基本工具,與網(wǎng)絡(luò)理論、信號(hào)與系統(tǒng)、控制論、通信理論、故障診斷等也密切相關(guān)。近來新興的一些學(xué)科,如人工智能、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)等,都與數(shù)字信號(hào)處理密不可分??梢哉f,數(shù)字信號(hào)處理是把許多經(jīng)典的理
19、論體系作為自己的理論基礎(chǔ),同時(shí)又使自己成為一系列新興學(xué)科的理論基礎(chǔ)。</p><p> 1.4 本文主要工作</p><p> 本文簡(jiǎn)要介紹了語音信號(hào)采集與分析的發(fā)展史以及語音信號(hào)的特征、采集與分析方法,并通過PC機(jī)錄制自己的一段聲音,運(yùn)用Matlab進(jìn)行仿真分析,最后加入噪聲進(jìn)行濾波處理,比較濾波前后的變化。第2章主要介紹語音信號(hào)的特點(diǎn)與采集,仿真主要是驗(yàn)證奈奎斯特定理。第3章主要是
20、對(duì)語音信號(hào)進(jìn)行時(shí)域、頻域上的分析,如短時(shí)功率譜,短時(shí)能量,短時(shí)平均過零率,語譜圖分析等等。第4章是對(duì)語音信號(hào)的綜合和分析,包括語音信號(hào)的調(diào)制、疊加和濾波。</p><p> 2 語音信號(hào)的特點(diǎn)與采集</p><p> 2.1 語音信號(hào)的特點(diǎn)</p><p> 通過對(duì)大量語音信號(hào)的觀察和分析發(fā)現(xiàn),語音信號(hào)主要有下面兩個(gè)特點(diǎn):</p><p&g
21、t; 在頻域內(nèi),語音信號(hào)的頻譜分量主要集中在300~3400Hz的范圍內(nèi)。利用這個(gè)特點(diǎn),可以用一個(gè)防混迭的帶通濾波器將此范圍內(nèi)的語音信號(hào)頻率分量取出,然后按8kHz的采樣率對(duì)語音信號(hào)進(jìn)行采樣,就可以得到離散的語音信號(hào)。</p><p> 在時(shí)域內(nèi),語音信號(hào)具有“短時(shí)性”的特點(diǎn),即在總體上,語音信號(hào)的特征是隨著時(shí)間而變化的,但在一段較短的時(shí)間間隔內(nèi),語音信號(hào)保持平穩(wěn)。在濁音段表現(xiàn)出周期信號(hào)的特征,在清音段表現(xiàn)出
22、隨機(jī)噪聲的特征。</p><p> 下面是一段語音信號(hào)的時(shí)域波形圖(圖2-1)和頻域圖(圖2-2),由這兩個(gè)圖可以看出語音信號(hào)的兩個(gè)特點(diǎn)。</p><p> 圖2-1語音信號(hào)時(shí)域波形圖 圖2-2語音信號(hào)頻域波形圖</p><p> 2.2語音信號(hào)的采集</p><p> 在將語音信號(hào)進(jìn)行數(shù)字化前,必須先進(jìn)行防混疊預(yù)濾波,預(yù)濾波
23、的目的有兩個(gè):抑制輸入信導(dǎo)各領(lǐng)域分量中頻率超出fs/2的所有分量(fs為采樣頻率),以防止混疊干擾。抑制50Hz的電源工頻干擾。這樣,預(yù)濾波器必須是一個(gè)帶通濾波器,設(shè)其上、下截止頻率分別是fH和fL,則對(duì)于絕大多數(shù)語音編譯碼器,fH=3400Hz、fL=60~100Hz、采樣率為fs=8kHz;而對(duì)丁語音識(shí)別而言,當(dāng)用于電話用戶時(shí),指標(biāo)與語音編譯碼器相同。當(dāng)使用要求較高或很高的場(chǎng)合時(shí)fH=4500Hz或8000Hz、fL=60Hz、fs
24、=10kHz或20kHz。</p><p> 為了將原始模擬語音信號(hào)變?yōu)閿?shù)字信號(hào),必須經(jīng)過采樣和量化兩個(gè)步驟,從而得到時(shí)間和幅度上均為離散的數(shù)字語音信號(hào)。采樣也稱抽樣,是信號(hào)在時(shí)間上的離散化,即按照一定時(shí)間間隔△t在模擬信號(hào)x(t)上逐點(diǎn)采取其瞬時(shí)值。采樣時(shí)必須要注意滿足奈奎斯特定理,即采樣頻率fs必須以高于受測(cè)信號(hào)的最高頻率兩倍以上的速度進(jìn)行取樣,才能正確地重建波形,它是通過采樣脈沖和模擬信號(hào)相乘來實(shí)現(xiàn)的。下
25、圖時(shí)一段語音信號(hào)在采樣頻率44.1KHz情況下的頻譜圖。</p><p> 圖2-3原始信號(hào)時(shí)域波形圖和頻域波形圖</p><p> 由圖可知,這段語音信號(hào)的頻率主要集中在1KHz左右,當(dāng)采樣頻率為44.1KHz時(shí),由于采樣頻率比較大,所以采樣點(diǎn)數(shù)就越密,所得離散信號(hào)就越逼近于原信號(hào),頻譜也沒有發(fā)生混疊。</p><p> 圖2-4抽取后的信號(hào)時(shí)域波形圖和頻域
26、波形圖</p><p> 對(duì)上述信號(hào)進(jìn)行1/80采樣頻率抽取,即采樣頻率變?yōu)閷⒔?00Hz時(shí),由于采樣頻率比較小,所以采樣點(diǎn)數(shù)就稀疏,所得離散信號(hào)就越偏離于原信號(hào),頻譜也發(fā)生了混疊。</p><p> 在采樣的過程中應(yīng)注意采樣間隔的選擇和信號(hào)混淆:對(duì)模擬信號(hào)采樣首先要確定采樣間隔。如何合理選擇△t涉及到許多需要考慮的技術(shù)因素。一般而言,采樣頻率越高,采樣點(diǎn)數(shù)就越密,所得離散信號(hào)就越逼近
27、于原信號(hào)。但過高的采樣頻率并不可取,對(duì)固定長度(T)的信號(hào),采集到過大的數(shù)據(jù)量(N=T/△t),給計(jì)算機(jī)增加不必要的計(jì)算工作量和存儲(chǔ)空間;若數(shù)據(jù)量(N)限定,則采樣時(shí)間過短,會(huì)導(dǎo)致一些數(shù)據(jù)信息被排斥在外。采樣頻率過低,采樣點(diǎn)間隔過遠(yuǎn),則離散信號(hào)不足以反映原有信號(hào)波形特征,無法使信號(hào)復(fù)原,造成信號(hào)混淆。根據(jù)采樣定理,當(dāng)采樣頻率大于信號(hào)的兩倍帶寬時(shí),采樣過程不會(huì)丟失信息,利用理想濾波器可從采樣信號(hào)中不失真地重構(gòu)原始信號(hào)波形。量化是對(duì)幅值進(jìn)行
28、離散化,即將振動(dòng)幅值用二進(jìn)制量化電平來表示。量化電平按級(jí)數(shù)變化,實(shí)際的振動(dòng)值是連續(xù)的物理量。具體振動(dòng)值用舍入法歸到靠近的量化電平上。 </p><p> 語音信號(hào)經(jīng)過預(yù)濾波和采樣后,由A/D變換器變換為二進(jìn)制數(shù)字碼。這種防混疊濾波通常與模數(shù)轉(zhuǎn)換器做在一個(gè)集成塊內(nèi),因此目前來說,語音信號(hào)的數(shù)字化的質(zhì)量還是有保證的。市面上購買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經(jīng)過防混疊濾波、A
29、/D變換、量化處理的離散的數(shù)字信號(hào)。</p><p> 在實(shí)際工作中,我們可以利用windows自帶的錄音機(jī)錄制語音文件,圖2-5是基于PC機(jī)的語音信號(hào)采集過程,聲卡可以完成語音波形的A/D轉(zhuǎn)換,獲得WAVE文件,為后續(xù)的處理儲(chǔ)備原材料。調(diào)節(jié)錄音機(jī)保存界面的“更改”選項(xiàng),可以存儲(chǔ)各種格式的WAVE文件。</p><p> 圖2-5基于PC機(jī)的語音信號(hào)采集過程</p>&l
30、t;p> 采集到語音信號(hào)之后,需要對(duì)語音信號(hào)進(jìn)行分析,如語音信號(hào)的時(shí)域分析、頻譜分析、語譜圖分析以及加噪濾波等處理。</p><p><b> 3 語音信號(hào)的分析</b></p><p> 3.1語音信號(hào)分析技術(shù)</p><p> 語音信號(hào)分析是語音信號(hào)處理的前提和基礎(chǔ),只有分析出可表示語音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)
31、進(jìn)行高效的語音通信、語音合成和語音識(shí)別等處理。而且,語音合成的音質(zhì)好壞,語音識(shí)別率的高低,也都取決于對(duì)語音信號(hào)分析的準(zhǔn)確性和精確性。因此語音信號(hào)分析在語音信號(hào)處理應(yīng)用中具有舉足輕重的地位。</p><p> 貫穿于語音分析全過程的是“短時(shí)分析技術(shù)”。因?yàn)?,語音信號(hào)從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間而變化的,所以它是一個(gè)非平穩(wěn)態(tài)過程,不能用處理平穩(wěn)信號(hào)的數(shù)字信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但是,由于不
32、同的語音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運(yùn)動(dòng)相對(duì)于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音信號(hào)具有時(shí)變特性,但是在一個(gè)短時(shí)間范圍內(nèi)(一般認(rèn)為在10~30ms的短時(shí)間內(nèi)),其特性基本保持不變即相對(duì)穩(wěn)定,因而可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程,即語音信號(hào)具有短時(shí)平穩(wěn)性。所以任何語音信號(hào)的分析和處理必須建立在“短時(shí)”的基礎(chǔ)上.即進(jìn)行“短時(shí)分析”,將語音信號(hào)分為一段一段來分析其特征參數(shù),其中每一段稱為一“幀
33、”,幀長一般取為10~30ms。這樣,對(duì)于整體的語音信號(hào)來講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。</p><p> 根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語音信號(hào)分析分為時(shí)域分析、頻域分析、倒頻域分析等;時(shí)域分析方法具有簡(jiǎn)單、計(jì)算量小、物理意義明確等優(yōu)點(diǎn),但由于語音信號(hào)最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對(duì)于時(shí)域分析來說頻域分析更為重要。本文將簡(jiǎn)要介紹時(shí)域分析、頻域分
34、析以及語譜圖分析。</p><p> 3.2 語音信號(hào)的時(shí)域分析</p><p> 語音信號(hào)的時(shí)域分析就是分析和提取語音信號(hào)的時(shí)域參數(shù)。進(jìn)行語音分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。語音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預(yù)處理、大分類等。這種分
35、析方法的特點(diǎn)是:表示語音信號(hào)比較直觀、物理意義明確。實(shí)現(xiàn)起來比較簡(jiǎn)單、運(yùn)算且少??梢缘玫秸Z音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。</p><p> 語音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過零率、短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)等,這是語音信號(hào)的一組最基本的短時(shí)參數(shù),在各種語音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參數(shù)時(shí)使用的一般是矩形窗或漢明窗。</p><p>
36、3.2.1 短時(shí)能量及短時(shí)平均幅度分析</p><p> 設(shè)語音波形時(shí)域信號(hào)為x(l)、加密分幀處理后得到的第n幀語音信號(hào)為 Xn(m),則Xn(m)滿足下式:</p><p> 其中,n=0,1T,2T,…,并且N為幀長,T為幀移長度。</p><p> 設(shè)第n幀語音信號(hào)Xn(m)的短時(shí)能量用En表示,則其計(jì)算公式如下:</p><p&g
37、t; En是一個(gè)度量語音信號(hào)幅度值變化的函數(shù),但它有一個(gè)缺陷,即它對(duì)高電平非常敏感(因?yàn)樗?jì)算時(shí)用的是信號(hào)的平方)。為此可采用另一個(gè)度量語音信號(hào)幅度值變化的函數(shù).即短時(shí)平均幅度函數(shù)Mn,它定義為: </p><p> Mn也是一幀語音信號(hào)能量大小的表征,它與En的區(qū)別在于計(jì)算時(shí)小取樣值和大取樣值不會(huì)因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域也會(huì)帶來一些好處。</p><p> 短時(shí)能量
38、和短時(shí)平均幅度函數(shù)的主要用途有:①可以區(qū)分濁音段與清音段,因?yàn)闈嵋魰r(shí)En值比清音時(shí)大的多。②可以用來區(qū)分聲母與韻母的分界,無聲與有聲的分界,連字(指字之間無間隙)的分界等。③作為一種超音段信息,用于語音識(shí)別中。</p><p> 3.2.2短時(shí)過零率分析</p><p> 短時(shí)過零率表示一幀語音中語音信號(hào)波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時(shí)域分析中最簡(jiǎn)單的一種。對(duì)于連續(xù)語音信
39、號(hào),過零即意味著時(shí)域波形通過時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過零。過零率就是樣本改變符號(hào)的次數(shù)。定義語音信號(hào)Xn(m)的短時(shí)過零率Zn為:</p><p> 式中,sgn[ ]是符號(hào)函數(shù),即:</p><p> 在實(shí)際中求過零率參數(shù)時(shí),需要十分注意的一個(gè)問題是如果輸入信號(hào)中包含有50Hz的工頻干擾或者A/D變換器的工作點(diǎn)有偏移(這等效于輸入信號(hào)有直流偏移),往往會(huì)
40、使計(jì)算的過零率參數(shù)很不準(zhǔn)確。為了解決前一個(gè)問題,A/D變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于50Hz,以有效地抑制電源干擾。對(duì)于后一個(gè)問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。</p><p> 對(duì)語音信號(hào)進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門波引起功率譜的高頻跌落,所以其話音能量約集中在3kHz以下。而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻
41、率上。高頻就意味著高的平均過零率,低頻意味著低的平均過零率,所以可以認(rèn)為濁音時(shí)具有較低的過零率,而清音時(shí)具有較高的過零率。當(dāng)然,這種高低僅是相對(duì)而言,并沒有精確的數(shù)值關(guān)系。</p><p> 利用短時(shí)平均過零率還可以從背景噪聲中找出語音信號(hào),可用于判斷寂靜無聲段和有聲段的起點(diǎn)和終點(diǎn)位置。在孤立詞的語音識(shí)別中,必須要在一連串連續(xù)的語音信號(hào)中進(jìn)行適當(dāng)分割,用以確定一個(gè)一個(gè)單詞的語音信號(hào),即找出每一個(gè)單詞的開始和終止
42、位置,這在語音處理中是一個(gè)基本問題。此時(shí),在背景噪聲較小時(shí)用平均能量識(shí)別較為有效,而在背景噪聲較大時(shí)用平均過零率識(shí)別較為有效。但是研究表明,在以某些音為開始或結(jié)尾時(shí)。如當(dāng)弱摩擦音(如[f]、[h]等音素),弱爆破音(如[p]、[t]、[k]等音素)為語音的開頭或結(jié)尾;以鼻音(如[n]、[m]等音素)為語音的結(jié)尾時(shí)。只用其中一個(gè)參量來判別語音的起點(diǎn)和終點(diǎn)是有困難的,必須同時(shí)使用這兩個(gè)參數(shù)。圖3-1是用Mtalab仿真一段語音信號(hào)時(shí)域波形的
43、短時(shí)能量和短時(shí)平均過零率。</p><p> 圖3-1語音信號(hào)的短時(shí)能量和短時(shí)平均過零率</p><p> 3.3 語音信號(hào)的頻域分析</p><p> 語音信號(hào)的頻域分析就是分析語音信號(hào)的頻域持征。從廣義上講,語音信號(hào)的頻域分析包括語音信號(hào)的頻譜、功率譜、倒頻譜、頻譜包絡(luò)分析等,而常用的頻域分析方法有帶通濾波器組法、傅里葉變換法、線性預(yù)測(cè)法等幾種。本文介紹的
44、是語音信號(hào)的傅里葉分析法。因?yàn)檎Z音波是一個(gè)非平穩(wěn)過程,因此適用于周期、瞬變或平穩(wěn)隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅里葉變換不能用來直接表示語音信號(hào),而應(yīng)該用短時(shí)傅里葉變換對(duì)語音信號(hào)的頻譜進(jìn)行分析,相應(yīng)的頻譜稱為“短時(shí)譜”。</p><p> 3.3.1利用短時(shí)博里葉變換求語音的短時(shí)譜</p><p> 對(duì)第n幀語音信號(hào)Xn(m)進(jìn)行傅里葉變換(離散時(shí)域傅里葉變換,DTFT),可得到短時(shí)傅里葉變換,其定義
45、如下:</p><p><b> (3-1)</b></p><p> 由定義可知,短時(shí)傅里葉變換實(shí)際就是窗選語音信號(hào)的標(biāo)準(zhǔn)傅里葉變換。這里,窗w(n-m)是一個(gè)“滑動(dòng)的”窗口,它隨n的變化而沿著序列X(n)滑動(dòng)。由于窗口是有限長度的,滿足絕對(duì)可和條件,所以這個(gè)變換是存在的。當(dāng)然窗口函數(shù)不同,博里葉變換的結(jié)果也將不同。</p><p>
46、我們還可以將式(3—1)寫成另一種形式。設(shè)語音信號(hào)序列和窗口序列的標(biāo)準(zhǔn)傅里立葉變換均存在。當(dāng)n取固定值時(shí),w(n-m)的傅里葉變換為:</p><p><b> (3-2)</b></p><p><b> 根據(jù)卷積定理,有:</b></p><p><b> (3-3)</b></p&g
47、t;<p> 因?yàn)樯鲜接疫厓蓚€(gè)卷積項(xiàng)均為關(guān)于角頻率w的以2π為周期的連續(xù)函數(shù),所以也可將其寫成以下的卷積積分形式:</p><p><b> ?。?-4)</b></p><p> 即,假設(shè)x(m)的DTFT是,且的DTFT是,那么是和的周期卷積。</p><p> 根據(jù)信號(hào)的時(shí)寬帶寬積為一常數(shù)這一基本性質(zhì),可知主瓣寬度與窗
48、口寬度成反比,N越大,的主瓣越窄。由式(3-4)可知,為了使忠實(shí)再現(xiàn)的特性。相對(duì)于來說必須是—個(gè)沖激函數(shù)。所以為了使,需;但是N值太大時(shí),信號(hào)的分幀又失去了意義。尤其是N大于語音的音素長度時(shí),已不能反映該語音音素的頻譜了。因此,應(yīng)折衷選擇窗的寬度N。另外,窗的形狀也對(duì)短時(shí)傅氏頻譜有影響,如矩形窗,雖然頻率分辨率很高(即主辯狹窄尖銳),但由于第一旁瓣的衰減很小,有較大的上下沖,采用矩形窗時(shí)求得的與的偏差較大,這就是Gibbs效應(yīng),所以不適
49、合用于頻譜成分很寬的語音分析中。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點(diǎn)。所以在求短時(shí)頻譜時(shí)一般采用具有較小上下沖的漢明窗。</p><p> 與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一樣,如令角頻率w=2πk/N,則得離散的短時(shí)傅里葉變換(DFT)。它實(shí)際上是在頻域的取樣,如下所示:</p><p><b> (3-5)</b>&l
50、t;/p><p> 在語音信號(hào)數(shù)字處理中,都是采用的離散博里葉變換(DFT)來替代并且可以用高效的快速傅里葉變換(FFT)算法完成由至的轉(zhuǎn)換。當(dāng)然,這時(shí)窗長N必須是2的倍數(shù)(L是整數(shù))。根據(jù)傅里葉變換的性質(zhì),實(shí)數(shù)序列的傅里葉變換的頻譜具有對(duì)稱性,因此,全部頻譜信息包含在長度為N/2+1個(gè)里。另外,為了使具有較高的頻率分辨率,所取的DFT以及相應(yīng)的FFT點(diǎn)數(shù)應(yīng)該足夠多,但有時(shí)的長度N要受到采樣率和短時(shí)性的限制,例如,
51、在通常采樣率為8kHz且?guī)L為20ms時(shí),N=160。而一般取256、512或1024,為了將的點(diǎn)數(shù)從N擴(kuò)大力,可以采用補(bǔ)0的辦法,在擴(kuò)大的部分添若干個(gè)0取樣值,然后再對(duì)添0后的序列進(jìn)行FFT。例如、在10kHz的范圍內(nèi)采樣求頻譜,并要求頻率分辨率在30Hz以下。由10k/<30,得>333,所以=要取比333大的值,這時(shí)可取==512點(diǎn),不足的部分采用補(bǔ)0的辦法解決,此時(shí)頻率分辨率(即頻率間隔)為10Hz/512=19.53Hz,采樣
52、后的該幀信號(hào)頻率處在0~之間,因此,原連續(xù)信號(hào)頻率就處在0~之間(即),所以我們要在0~頻率范圍內(nèi)求其頻譜。FFT的計(jì)算可以在通用計(jì)算機(jī)上由相應(yīng)的算法軟件來完成,</p><p> 在語音信號(hào)數(shù)字處理中,功率譜具有重要意義,在一些語音應(yīng)用系統(tǒng)中。往往都是利用語音信號(hào)的功率譜。根據(jù)功率譜定義,可以寫出短時(shí)功率譜與短時(shí)傅里葉變換之間的關(guān)系:</p><p> 或者: &
53、lt;/p><p> 式中*表示復(fù)共軛運(yùn)算。并且功率譜是短時(shí)自相關(guān)函數(shù)的傅里葉變換。</p><p> 圖3-2是用Matlab中的psdplot命令繪得的同一人兩次說同一詞的功率譜比較(窗函數(shù)取窗長度為256的Hamming窗)。</p><p> 圖3-2同一人兩次說同一詞的功率譜比較</p><p> 可以看出功率譜圖比較好地反映出
54、聲音的個(gè)人特征:在低頻部分(頻率低于6000Hz),同一人說同一詞,其功率譜圖中的各個(gè)波峰所對(duì)應(yīng)的頻率基本相同;不同人說同一詞,其功率譜圖的出現(xiàn)波峰的頻率比較接近;同一人說不同詞時(shí)功率譜的形狀差別較大。在高頻部分,波峰比較密集,特征不明顯。</p><p> 3.4 語音信號(hào)的語譜圖</p><p> 語音的時(shí)域分析和頻域分析是語音分析的兩種重要方法。顯然這兩種單獨(dú)分析的方法均有局限性
55、:時(shí)域分析對(duì)語音信號(hào)的頻率特性沒有直觀的了解;而頻域分析出的特征中又沒有語音信號(hào)隨時(shí)間的變化關(guān)系;語音信號(hào)是時(shí)變信號(hào),所以其頻譜也是隨時(shí)間變化的。但是由于語音信號(hào)隨時(shí)間變化是很緩慢的,因而在一段短時(shí)間內(nèi)(如10~30ms之間,即所謂的一幀之內(nèi))可以認(rèn)為其頻譜是固定不變的,這種頻譜又稱為短時(shí)譜。短時(shí)譜只能反映語音信號(hào)的靜態(tài)頻率特性,不能反映語音信號(hào)的動(dòng)態(tài)頻率特性。因此,人們致力于研究語音的時(shí)頻分析特性。</p><p&
56、gt; 把和時(shí)序相關(guān)的傅里葉分析的顯示圖形稱為語譜圖(Sonogram,或者Spectrogram)。語譜圖是一種三維頻譜,它是表示語音頻譜隨時(shí)間變化的圖形,其縱軸為頻率,橫軸為時(shí)間,任一給定頻率成分在給定時(shí)刻的強(qiáng)弱用相應(yīng)點(diǎn)的灰度或色調(diào)的濃淡來表示。用語譜圖分析語音又稱為語譜分析。語譜圖中顯示了大量的與語音的語句特性有關(guān)的信息,它綜合了頻譜圖和時(shí)域波形的特點(diǎn),明顯地顯示出語音頻譜隨時(shí)間的變化情況,或者說是一種動(dòng)態(tài)的頻譜;記錄這種頻譜的
57、儀器就是語譜儀。</p><p> 語譜儀實(shí)際上是一個(gè)帶通濾波器組的輸出隨時(shí)間發(fā)生連續(xù)變化,連續(xù)重復(fù)進(jìn)行語音信號(hào)頻率分析的儀器。帶通濾波器有兩種帶寬可供選擇:窄帶為45Hz,寬帶為300Hz。窄帶語譜圖有良好的頻率分辨率,有利于顯示基音頻率及其各次諧波,但它的時(shí)間分辨率較差,不利于觀察共振峰(聲道諧振)的變化;而寬帶語譜圖正相反,具有良好的時(shí)間分辨率及較差的頻率分辨率。寬帶語譜圖能給出語音的共振峰頻率及清輔音的
58、能量匯集區(qū),在語譜圖里共振峰呈現(xiàn)為黑色的條紋。</p><p> 可以利用語譜儀測(cè)量語譜圖的方法來確定語音參數(shù),例如共振峰頻率及基音頻率。語語圖的實(shí)際應(yīng)用是用于確定出講話人的本性。語譜圖上因其不同的黑白程度,形成了個(gè)同的紋路,稱之為“聲紋”,它因人而異,即不同講話者語譜圖的聲紋是不同的。因而可以利用聲紋鑒別不同的講話人。這與不同的人有不同的指紋,根據(jù)指紋可以區(qū)別不同的人是一個(gè)道理。雖然對(duì)采用語譜圖的講活人識(shí)別技
59、術(shù)的可靠性存在相當(dāng)?shù)膽岩?,但目前這一技術(shù)已在司法法庭得到某些認(rèn)可及采用。</p><p> 圖3-3“河南理工大學(xué)”語譜圖</p><p> 圖3-3是用Mtalab繪制的一個(gè)寬帶語譜圖,其中橫抽坐標(biāo)為時(shí)間,縱軸坐標(biāo)為頻率,語句內(nèi)容為“河南城建學(xué)院”,它的發(fā)音在圖下方以音標(biāo)表示。同時(shí)給出了相應(yīng)的語音的時(shí)域波形。語譜圖中的花紋有橫扛(Bar)、亂紋和豎直條等。橫杠是與時(shí)間軸平行的幾條深黑
60、色帶紋,它們相應(yīng)于短時(shí)譜中的幾個(gè)凸出點(diǎn),也就是共振峰。從橫扛對(duì)應(yīng)的頻率和寬度可以確定相應(yīng)的共振峰頻率和帶寬。在一個(gè)語音段的語譜圖中,有沒有橫扛出現(xiàn)是判斷它是否是濁音的重要標(biāo)志。豎直條(又叫沖直條)是語譜圖中出現(xiàn)與時(shí)間軸垂直的一條窄黑條。每個(gè)豎直條相當(dāng)于一個(gè)基音,條紋的起點(diǎn)相當(dāng)于聲門脈沖的起點(diǎn),條紋之間的距離表示基音周期。條紋越密表示越音頻率越高。</p><p> 4 語音信號(hào)的綜合仿真分析</p>
61、<p> 4.1本文的仿真軟件Matlab</p><p> MATLAB將矩陣運(yùn)算、數(shù)值分析、圖形處理、編程技術(shù)結(jié)合在一起,為用戶提供了一個(gè)強(qiáng)有力的科學(xué)及工程問題的分析計(jì)算和程序設(shè)計(jì)工具,它還提供了專業(yè)水平的符號(hào)計(jì)算、文字處理、可視化建模仿真和實(shí)時(shí)控制等功能,是具有全部語言功能和特征的新一代軟件開發(fā)平臺(tái)。</p><p> MATLAB 已發(fā)展成為適合眾多學(xué)科、多種工
62、作平臺(tái)、功能強(qiáng)大的大型軟件。在歐美等國家的高校,MATLAB已成為線性代數(shù)、自動(dòng)控制理論、數(shù)理統(tǒng)計(jì)、數(shù)字信號(hào)處理、時(shí)間序列分析、動(dòng)態(tài)系統(tǒng)仿真等高級(jí)課程的基本教學(xué)工具。成為攻讀學(xué)位的本科、碩士、博士生必須掌握的基本技能。在設(shè)計(jì)研究單位和工業(yè)開發(fā)部門,MATLAB被廣泛的應(yīng)用于研究和解決各種具體問題。在中國,MATLAB也已日益受到重視,短時(shí)間內(nèi)就將盛行起來,因?yàn)闊o論哪個(gè)學(xué)科或工程領(lǐng)域都可以從MATLAB中找到合適的功能。</p>
63、;<p> MATLAB的功能 </p><p> 1)全新的開發(fā)環(huán)境GUIDE(GUI Development Environment):由早期的單一命令窗口發(fā)展為將一些常用的交互式工作界面高度的集中于操作桌面; </p><p> 2)在命令窗口增加了錯(cuò)誤跟蹤功能(error display message and abort function); </p&
64、gt;<p> 3)提供了許多新的數(shù)值處理功能(numerical Treatment Techniques),更新了部分函數(shù)的功能和算法,增加了許多新函數(shù); </p><p> 4)在圖形窗口增加了曲線擬合、數(shù)據(jù)統(tǒng)計(jì)等交互工具;(Curve Fitting, Data Analyzing ) </p><p> 5)引入了類與對(duì)象及函數(shù)句柄等概念;(Object,Ha
65、ndle) 用戶可以創(chuàng)建自己定義的類函數(shù)和函數(shù)句柄; </p><p> 6)改進(jìn)了編輯/調(diào)試器的界面及功能; (Editor/Debugger)增加了行號(hào)和書簽等功能; </p><p> 7)屬性編輯器功能更強(qiáng)(Property Debugger),使用更方便; </p><p> 8)建立了一個(gè)與以前完全不同的圖形用戶界面(GUI)圖形窗口,(Graph
66、ical Window)使用更加方便靈活; </p><p> 9)增加了虛擬現(xiàn)實(shí)工具箱,(Virtual Reality Toolbox)使用標(biāo)準(zhǔn)的虛擬現(xiàn)實(shí)建模語言(VRML)技術(shù),可以創(chuàng)建由MATLAB和simulink環(huán)境驅(qū)動(dòng)的三維動(dòng)畫場(chǎng)景; </p><p> 10)在應(yīng)用程序接口方面增加了與Java的接口(Interface for Java),并為二者的數(shù)據(jù)交換提供了相應(yīng)的
67、程序庫。 </p><p> MATLAB的主要組成部分: </p><p> 1)開發(fā)環(huán)境(development Environment):一組圖形化用戶接口工具和組件的集成:MATLAB桌面、命令窗口、命令歷史窗口、編輯調(diào)試窗口及幫助信息、工作空間、文件和搜索路徑等瀏覽器; </p><p> 2)MATLAB數(shù)學(xué)函數(shù)庫:(Math Function L
68、ibrary)基本函數(shù):求和、正弦、余弦和復(fù)數(shù)運(yùn)算等;特殊函數(shù):矩陣求逆、矩陣特征值、貝塞爾函數(shù)和快速付里葉變換等; </p><p> 3)MATLAB語言:(MATLAB Language)一種高級(jí)編程語言,包括控制流的描述、函數(shù)、數(shù)據(jù)結(jié)構(gòu)、輸入輸出及面對(duì)對(duì)象編程; </p><p> 4)句柄圖形:(Handle Graphics) 可以對(duì)各種圖形對(duì)象進(jìn)行更為細(xì)膩的修飾和控制,建
69、立完整的圖形界面的應(yīng)用程序。 </p><p> 5)應(yīng)用程序接口:(Applied Function Interface)MATLAB的應(yīng)用程序接口允許用戶使用C或FORTRAN語言編寫程序與MATLAB連接。 </p><p> 工作空間窗口:(Workspace Window) </p><p> 用于儲(chǔ)存各種變量和結(jié)果的空間,顯示變量的名稱、大小、字節(jié)
70、數(shù)及數(shù)據(jù)類型,對(duì)變量進(jìn)行觀察、編輯、保存和刪除。臨時(shí)變量不占空間,為了對(duì)變量的內(nèi)容進(jìn)行觀察、編輯與修改,可以用三種方法打開內(nèi)存數(shù)組編輯器。*雙擊變量名;*選擇該窗口工具欄上的打開圖標(biāo);*鼠標(biāo)指向變量名,點(diǎn)擊鼠標(biāo)右鍵,彈出選擇菜單,然后選項(xiàng)操作。</p><p> 欲查看工作空間的情況,可以在命令窗口鍵入命令whos(顯示存在工作空間全部變量的名稱、大小、數(shù)據(jù)類型等信息)或命令who(只顯示變量名) </p
71、><p> 當(dāng)前目錄瀏覽器:(Current Directory) </p><p> 用于顯示及設(shè)置當(dāng)前工作目錄,同時(shí)顯示當(dāng)前工作目錄下的文件名、文件類型及目錄的修改時(shí)間等信息。只有在當(dāng)前目錄或搜索路徑下的文件及函數(shù)可以被運(yùn)行或調(diào)用。 </p><p> 設(shè)置當(dāng)前目錄可以在瀏覽器窗口左上角的輸入欄中直接輸入,或點(diǎn)擊瀏覽器下拉按鈕進(jìn)行選擇。還可用cd命令在命令窗口
72、設(shè)置當(dāng)前目錄,如: </p><p> cd c:\mydir 可將c盤上的mydir目錄設(shè)為當(dāng)前工作目錄。 </p><p> 命令歷史窗口:(Command History) </p><p> 記錄已運(yùn)行過的MATLAB命令歷史,包括已運(yùn)行過的命令、函數(shù)、表達(dá)式等信息,可進(jìn)行命令歷史的查找、檢查等工作,也可以在該窗口中進(jìn)行命令復(fù)制與重運(yùn)行。</p&
73、gt;<p> 啟動(dòng)平臺(tái):(Launch Pad) </p><p> 幫助用戶方便地打開和調(diào)用MATLAB的各種程序、函數(shù)和幫助文件。 </p><p> 平臺(tái)列出了系統(tǒng)中安裝的所有的MATLAB產(chǎn)品的目錄,可以通過雙擊來啟動(dòng)相應(yīng)的選項(xiàng)。7.0版取消了這個(gè)窗口,事實(shí)上Help工具完全具備它的功能。</p><p><b> 基本功能
74、</b></p><p> MATLAB是由美國mathworks公司發(fā)布的主要面對(duì)科學(xué)計(jì)算、可視化以及交互式程序設(shè)計(jì)的高科技計(jì)算環(huán)境。它將數(shù)值分析、矩陣計(jì)算、科學(xué)數(shù)據(jù)可視化以及非線性動(dòng)態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個(gè)易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計(jì)以及必須進(jìn)行有效數(shù)值計(jì)算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計(jì)語言(如C、Fortran)
75、的編輯模式,代表了當(dāng)今國際科學(xué)計(jì)算軟件的先進(jìn)水平。MATLAB和Mathematica、Maple并稱為三大數(shù)學(xué)軟件。它在數(shù)學(xué)類科技應(yīng)用軟件中在數(shù)值計(jì)算方面首屈一指。MATLAB可以進(jìn)行矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實(shí)現(xiàn)算法、創(chuàng)建用戶界面、連matlab開發(fā)工作界面接其他編程語言的程序等,主要應(yīng)用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等領(lǐng)域。MATLAB的基本數(shù)據(jù)單位是矩陣,它的指令表達(dá)式與數(shù)學(xué)、工程中
76、常用的形式十分相似,故用MATLAB來解算問題要比用C、FORTRAN等語言完成相同的事情簡(jiǎn)捷得多,并且MATLAB也吸收了像Maple等軟件的優(yōu)點(diǎn),使MATLAB成為一個(gè)強(qiáng)大的數(shù)學(xué)軟件</p><p><b> 4.2原始語音信號(hào)</b></p><p> 錄制一段自己的語音信號(hào),并對(duì)錄制的信號(hào)進(jìn)行采樣;畫出采樣后語音信號(hào)的時(shí)域波形和頻譜圖;</p>
77、<p> %語音信號(hào)時(shí)域頻域分析</p><p> [y,Fs,bits]=wavread('2.wav');%讀出信號(hào),采樣率和采樣位數(shù) </p><p> y=y(:,1);%我這里假設(shè)你的聲音是雙聲道,我只取單聲道作分析 </p><p> sigLength=length(y);%算出y的長度</p>&
78、lt;p> Y = fft(y,sigLength);%在sigLength這個(gè)有限區(qū)間內(nèi)做快速傅立葉變換</p><p> Pyy = Y.* conj(Y) / sigLength; %Y乘Y的共軛,得到功率譜</p><p> halflength=floor(sigLength/2); %半寬度</p><p> f=Fs*(0:halflen
79、gth)/sigLength; %采樣頻率的橫坐標(biāo)</p><p> figure;plot(f,Pyy(1:halflength+1));xlabel('Frequency(Hz)'); %在第一個(gè)窗口畫率譜</p><p> t=(0:sigLength-1)/Fs; %計(jì)算時(shí)間軸</p><p> figure;plot(t,y);xla
80、bel('Time(s)'); %在第二個(gè)窗口畫波形</p><p> 圖4-1原始語音信號(hào)</p><p> 由圖可知這段語音信號(hào)頻率主要集中在1000Hz左右。</p><p> 4.3對(duì)語音信號(hào)進(jìn)行調(diào)制</p><p> 為了減少在傳輸時(shí)的耗損,人們一般是先對(duì)傳輸信號(hào)進(jìn)行特殊處理,然后再傳遞。把原始的待傳信號(hào)托附
81、到高頻振蕩的過程稱為調(diào)制。我們知道音頻信號(hào)的頻率在我們的聽覺范圍內(nèi),音頻信號(hào)在無線傳輸?shù)倪^程中會(huì)受到各種聲音的干擾而產(chǎn)生能量消耗,因此限制了傳輸?shù)木嚯x,所以在現(xiàn)實(shí)的傳送過程中要現(xiàn)對(duì)語音信號(hào)進(jìn)行調(diào)制再發(fā)送出去。</p><p> 若欲傳送信號(hào)為其振幅限制不可大于一</p><p><b> 載波為</b></p><p> fc為載波中心頻
82、率,單位為赫茲。A是任意振幅。傳送信號(hào)將會(huì)是</p><p><b> 在此, </b></p><p> 公式中,f(t)是振蕩器的瞬時(shí)頻率,fΔ是頻偏(頻率偏移),代表在一個(gè)方向上相對(duì)fc的最大頻率偏離,在此我們假定xm(t)是有限的幅值限于±1之間。</p><p> 下面是對(duì)一段語音信號(hào)的調(diào)制仿真圖,載波頻率為fc=20
83、000。</p><p> 圖4-2調(diào)制后的語音信號(hào)</p><p> 由圖可知,經(jīng)過調(diào)制后的語音信號(hào)頻譜都搬移到fc=20000的頻段。</p><p> 4.4設(shè)計(jì)數(shù)字濾波器和畫出頻率響應(yīng)</p><p> 根據(jù)語音信號(hào)的特點(diǎn)給出有關(guān)濾波器的性能指標(biāo):</p><p> 低通濾波器性能指標(biāo),fp=1000
84、Hz,fc=1200Hz,As=100dB,Ap=1dB;</p><p> 用雙線性變換法設(shè)計(jì)的低通濾波器的程序如下:</p><p> fp=1000;fc=1200;As=100;Ap=1;fs=22050;</p><p> wc=2*fc/fs;wp=2*fp/fs;</p><p> [n,wn]=ellipord(wp,
85、wc,Ap,As);</p><p> [b,a]=ellip(n,Ap,As,wn);</p><p> freqz(b,a,512,fs); </p><p><b> 濾波器的頻率響應(yīng)</b></p><p> 圖4-3濾波器的頻率響應(yīng) </p><p><b> 4.5
86、進(jìn)行低通濾波</b></p><p> 低通濾波可以簡(jiǎn)單的認(rèn)為:設(shè)定一個(gè)頻率點(diǎn),當(dāng)信號(hào)頻率高于這個(gè)頻率時(shí)不能通過,在數(shù)字信號(hào)中,這個(gè)頻率點(diǎn)也就是截止頻率,當(dāng)頻域高于這個(gè)截止頻率時(shí),則全部賦值為0。因?yàn)樵谶@一處理過程中,讓低頻信號(hào)全部通過,所以稱為低通濾波。比較濾波前后語音信號(hào)的波形及頻譜。低通濾波器(low-passfilter)容許低頻信號(hào)通過,但減弱(或減少)頻率高于截止頻率的信號(hào)的通過。對(duì)于不
87、同濾波器而言,每個(gè)頻率的信號(hào)的減弱程度不同。當(dāng)使用在音頻應(yīng)用時(shí),它有時(shí)被稱為高頻剪切濾波器或高音消除濾波器。低通濾波器在信號(hào)處理中的作用等同于其它領(lǐng)域如金融領(lǐng)域中移動(dòng)平均數(shù)(moving average)所起的作用。 </p><p><b> 程序如下:</b></p><p> [y,fs,bits]=wavread('e:\hy.wav');
88、 %函數(shù)wavread是對(duì)語音信號(hào)進(jìn)行 采樣,格式是[y,fs,nbit]=wavread,返回采樣值放在向量y中,fs表示采樣頻率(Hz),nbit表示采樣位數(shù)。</p><p> fp=1000;fs=2000;rp=0.5;rs=40;fc=40000;%設(shè)定通帶截止頻率(fp)、阻帶截止頻率(fs)、通帶波紋系數(shù)(rp)、阻帶波紋系數(shù)(rs)、抽樣頻率
89、(fc)。</p><p> wp=2*fp/fc;ws=2*fs/fc; %將模擬域轉(zhuǎn)化成數(shù)字域。</p><p> if get(handles.radiobutton1,'value')%如果選擇radiobutton1,則制做巴特沃思濾波器。</p><p> [N,Wc]=buttord(wp,ws,rp,r
90、s); %估算巴特沃思濾波器的階數(shù)N和3dB截止頻率Wc。</p><p> [num,den]=butter(N,Wc); %求傳輸函數(shù)的分子和分母多項(xiàng)式的系數(shù)。</p><p> else %選擇radiobutton2,則制做切比雪夫Ⅰ型濾波器。</p><p>
91、; [N,Wc]=cheb1ord(wp,ws,rp,rs); %估算切比雪夫Ⅰ型濾波器的階數(shù)N和截止頻率Wc。</p><p> [num,den]=cheby1(N,rp,Wc); %求傳輸函數(shù)的分子和分母多項(xiàng)式的系數(shù)。</p><p><b> end</b></p><p> x=filter(nu
92、m,den,y); %根據(jù)傳輸函數(shù)的分子和分母多項(xiàng)式的系數(shù)得到模擬濾波器,并將y通過該濾波器,得到x。</p><p> sound(x,fc,bits); %將濾波后的信號(hào)x進(jìn)行回放。</p><p> X=fft(x); %將x信號(hào)進(jìn)行快速傅里葉變換。</
93、p><p> plot(x); %在axes3坐標(biāo)軸上畫出x信號(hào)的波形圖。</p><p> plot(abs(X)); %在axes4坐標(biāo)軸上畫出頻譜圖。</p><p> 圖4-4 低通濾波后的信號(hào)波形和頻譜</p><p> 由圖4
94、-4可知低通濾波后,高頻分量被低通濾波器衰減。所以聲音稍微有些發(fā)悶、低沉,但是很接近原來的聲音。</p><p><b> 總 結(jié)</b></p><p> 通過這次課程設(shè)計(jì),使我對(duì)語音信號(hào)有了全面的認(rèn)識(shí),對(duì)數(shù)字信號(hào)處理的知識(shí)又有了深刻的理解,在之前數(shù)字信號(hào)與處理的學(xué)習(xí)以及完成課后的作業(yè)的過程中,已經(jīng)使用過MATLAB,對(duì)其有了一些基礎(chǔ)的了解和認(rèn)識(shí)。通過這次練習(xí)是
95、我進(jìn)一步了解了信號(hào)的產(chǎn)生、采樣及頻譜分析的方法。以及其中產(chǎn)生信號(hào)和繪制信號(hào)的基本命令和一些基礎(chǔ)編程語言。讓我感受到只有在了解課本知識(shí)的前提下,才能更好的應(yīng)用這個(gè)工具;并且熟練的應(yīng)用MATLAB也可以很好的加深我對(duì)課程的理解,方便我的思維。這次設(shè)計(jì)使我了解了MATLAB的使用方法,學(xué)會(huì)分析濾波器的優(yōu)劣和性能,提高了分析和動(dòng)手實(shí)踐能力。同時(shí)我相信,進(jìn)一步加強(qiáng)對(duì)MATLAB的學(xué)習(xí)與研究對(duì)我今后的學(xué)習(xí)將會(huì)起到很大的幫助。</p>
96、<p><b> 參 考 文 獻(xiàn)</b></p><p> [1]胡航.語音信號(hào)處理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2002.</p><p> [2]丁玉美.高西全.?dāng)?shù)字信號(hào)處理[M].西安電子科技大學(xué)出版社,2006.</p><p> [4]張威.MATLAB基礎(chǔ)與編程入門[M].西安電子科技大學(xué)出版社,2006.
97、</p><p> [5]林福宗.多媒體技術(shù)基礎(chǔ)[M].北京:清華大學(xué)出版社,2000. </p><p> [6]周淵,王炳和,劉斌勝.基于MATLAB的噪聲信號(hào)采集和分析系統(tǒng)的設(shè)計(jì)[M].噪聲控制.2004(7):52-54. </p><p> [7]朱學(xué)芳,徐建平.計(jì)算機(jī)語音信號(hào)處理與語音識(shí)別系統(tǒng)[J].南京郵電學(xué)院學(xué)報(bào),1998,18(5—6):11
98、3—1</p><p><b> 附錄一:</b></p><p> %語音信號(hào)時(shí)域頻域分析</p><p> [y,Fs,bits]=wavread('2.wav');%讀出信號(hào),采樣率和采樣位數(shù)。 </p><p> y=y(:,1);%我這里假設(shè)你的聲音是雙聲道,我只取單聲道作分析,如果你想
99、分析另外一個(gè)聲道,請(qǐng)改成y=y(:,2) </p><p> sigLength=length(y); </p><p> Y = fft(y,sigLength); </p><p> Pyy = Y.* conj(Y) / sigLength; </p><p> halflength=floor(sigLength/2); &l
100、t;/p><p> f=Fs*(0:halflength)/sigLength; </p><p> figure;plot(f,Pyy(1:halflength+1));xlabel('Frequency(Hz)'); </p><p> t=(0:sigLength-1)/Fs; </p><p> figure;pl
101、ot(t,y);xlabel('Time(s)');</p><p><b> 附錄二:</b></p><p><b> %抽取的源程序</b></p><p> [y,fs,bs]=wavread('d:\01.wav',[25000,75000]);</p><
102、;p><b> y=y(:,1);</b></p><p> lg=length(y);</p><p> yx=(0:(lg-1))*fs/lg;</p><p> yx=yx(1:lg/2);</p><p> % sound(y,fs);</p><p> figure(
103、1);</p><p> subplot(211);</p><p><b> plot(y);</b></p><p> title('原始信號(hào)');</p><p> subplot(212);</p><p> yf=abs(fft(y));</p>
104、<p> yf=yf(1:lg/2);</p><p> plot(yx,yf);</p><p> ycq=zeros(1,lg); %先將抽取后的值全設(shè)為零 </p><p> for i=1:80:lg; %通過循環(huán),每隔80個(gè)點(diǎn)將抽取后的值賦值為原函數(shù)的 </p><p> ycq(i)=y(i); %采樣值 &l
105、t;/p><p><b> end </b></p><p> sound(ycq,fs);</p><p> figure(2);</p><p> subplot(211);</p><p> plot(ycq);</p><p> title('抽取后
106、的信號(hào)');</p><p> subplot(212);</p><p> ycqf=abs(fft(ycq));</p><p> ycqf=ycqf(1:lg/2);</p><p> plot(yx,ycqf);</p><p><b> 附錄三:</b></p&g
107、t;<p> “河南成建學(xué)院”語譜圖源程序:</p><p> frmsize = 256; % 設(shè)置貞大小</p><p> [x,fs,nbits] = wavread('3.wav'); % 讀取語音文件</p><p> x = filter([1 -0.95],[1],x); % 高頻預(yù)加重,抵消頻譜傾斜</p&
108、gt;<p> n = length(x); frmcnt = floor(n/frmsize); </p><p> x = reshape(x(1:frmsize*frmcnt),frmsize,frmcnt); % 分幀</p><p> xFFT = abs(fft(x)); % 傅里葉譜</p><p> xFFT = xFFT(1:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于dsp的語音信號(hào)處理系統(tǒng)設(shè)計(jì)
- 基于DSP的語音信號(hào)采集與處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 課程設(shè)計(jì)--語音信號(hào)變聲處理系統(tǒng)
- 畢業(yè)論文---語音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)
- 畢業(yè)論文語音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)
- dsp語音信號(hào)處理課程設(shè)計(jì)
- 基于matlab語音信號(hào)處理去噪畢業(yè)設(shè)計(jì)
- 基于matlab語音信號(hào)處理去噪畢業(yè)設(shè)計(jì)論文
- 基于matlab語音信號(hào)處理去噪畢業(yè)設(shè)計(jì)論文
- 基于dsp的實(shí)時(shí)語音處理系統(tǒng)的設(shè)計(jì)
- 基于matlab語音信號(hào)處理設(shè)計(jì)
- 基于DSP技術(shù)的語音處理系統(tǒng)設(shè)計(jì).pdf
- 信號(hào)處理課程設(shè)計(jì)---基于matlab的語音信號(hào)處理
- 語音信號(hào)時(shí)域分析畢業(yè)設(shè)計(jì)論文
- 語音信號(hào)的采集與分析 畢業(yè)設(shè)計(jì)
- 基于DSP的多路信號(hào)處理系統(tǒng)設(shè)計(jì).pdf
- 基于DSP的語音處理系統(tǒng)的設(shè)計(jì)與研究.pdf
- 基于多DSP的信號(hào)處理系統(tǒng)的設(shè)計(jì).pdf
- 語音信號(hào)處理課程設(shè)計(jì)
- 畢業(yè)設(shè)計(jì)---語音信號(hào)的采集與分析
評(píng)論
0/150
提交評(píng)論