盲信號語音分離技術(shù)的研究與實現(xiàn)——畢業(yè)論文_第1頁
已閱讀1頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p>  本科畢業(yè)設(shè)計(論文)</p><p>  論文題目 盲信號語音分離技術(shù)的研究與實現(xiàn) </p><p>  Research and Implementation of the Voice Separation Technology for Blind Signal</p><p>  盲信號語音分離技術(shù)的研究與實現(xiàn)</p>

2、<p>  摘要:近年來語音信號的分離越來越受到大家的關(guān)注,它在助聽器及便攜設(shè)備、電話會議、各種語音識別方面有很多的應(yīng)用和影響,且語音分離的處理方法經(jīng)常在語音識別中得到實踐。其中“盲”是指不知道源語音信號的分布和傳輸信道的參數(shù)。盲信號語音分離的理論基礎(chǔ)是ICA獨立分量分析,ICA可以廣泛的應(yīng)用于圖像、通信、生物醫(yī)學(xué)、聲納、地震等多種類型信號的處理中。</p><p>  文章首先闡述了語音信號的特征,介

3、紹了獨立分量分析的理論算法。在此基礎(chǔ)上,對傳統(tǒng)的自適應(yīng)語音信號盲分離EASI算法進行了詳細(xì)的研究,由于EASI算法采用的是固定步長,其收斂速度和分離性能不能達(dá)到最佳結(jié)合。所以,本文提出了一種基于EASI算法的改進的變步長自適應(yīng)的語音信號盲分離算法,可以很好的解決收斂速度和分離性能之間的矛盾,并對其進行了算法性能仿真實驗。最終通過實驗結(jié)果表明,改進的自適應(yīng)盲分離算法優(yōu)于傳統(tǒng)的EASI算法。</p><p>  關(guān)鍵

4、詞:盲信號處理;獨立分量分析;EASI算法;變步長自適應(yīng)盲分離算法</p><p>  RESEARCH AND IMPLEMENTATION OF THE VOICE SEPARATION TECHNOLOGY FOR BLIND SIGNAL</p><p>  Abstract: Speech separation has been a hot topic in voice sign

5、al processing society recently years, which has many applications and influences in telephone conference, hearing aid, portable devices, speech recognition. The process of blind signal is a useful method in speech separa

6、tion, in which the term “blind” means that the source itself and the transmission channel is unknown. Independent component analysis is the theoretical basis of blind signal separation, which can be used in various sig&l

7、t;/p><p>  At first, the paper analyzes the theory and algorithm of Independent Component Analysis. On this basis, EASI algorithm was focused detail. As EASI algorithm used in a fixed step, so it does not achie

8、ve the best combination of the convergence rate and the separated performance. Therefore, an improved Variable step adaptive blind source separation based ICA algorithm was proposed. So it can improve convergence speed a

9、nd reduce the maladjustment error in the steady state simultaneously. Eventually,</p><p>  Keyword: Blind Signal Processing;Independent Component Analysis;EASI Algorithm;Variable Step Adaptive Blind Source S

10、eparation Based ICA Algorithm</p><p><b>  目 錄</b></p><p><b>  1 緒論1</b></p><p>  1.1 研究背景1</p><p>  1.2 國內(nèi)外研究現(xiàn)狀2</p><p>  1.3

11、研究的目的和意義4</p><p>  1.4 本文的主要內(nèi)容及工作安排5</p><p>  2 盲信號語音分離的概要研究5</p><p>  2.1語音信號的概述5</p><p>  2.1.1語音的特性5</p><p>  2.1.2語音信號的特征6</p><p>  

12、2.2 語音分離的數(shù)學(xué)模型6</p><p>  2.3 語音分離的研究內(nèi)容7</p><p>  2.4 語音分離的研究方法8</p><p>  2.4.1 獨立分量分析8</p><p>  2.4.2 對源語音信號的概率密度函數(shù)進行估計10</p><p>  2.4.3 目標(biāo)函數(shù)的選取和優(yōu)化算法1

13、1</p><p>  2.4.4 語音分離的評價指標(biāo)13</p><p>  2.4.5 ICA數(shù)據(jù)的預(yù)處理14</p><p>  2.5盲信號語音分離的主要流程16</p><p>  2.6本章小結(jié)17</p><p>  3 盲信號語音分離的詳細(xì)設(shè)計18</p><p>  

14、3.1 傳統(tǒng)的EASI算法分析18</p><p>  3.1.1 EASI算法18</p><p>  3.1.2 算法的流程19</p><p>  3.1.3 串音誤差ECT21</p><p>  3.1.4 算法中的步長因子u21</p><p>  3.2 改進的自適應(yīng)盲分離算法21</p

15、><p>  3.2.1 改進算法的分析22</p><p>  3.2.2 改進的自適應(yīng)盲分離算法的流程22</p><p>  3.2.3 改進算法的串音誤差ECT23</p><p>  3.3 本章小結(jié)24</p><p>  4 盲信號語音分離算法的仿真實驗24</p><p>

16、  4.1 語音分離算法的實現(xiàn)24</p><p>  4.1.1 實現(xiàn)平臺24</p><p>  4.1.2 運行環(huán)境25</p><p>  4.2 盲信號語音分離的算法仿真實驗25</p><p>  4.2.1 EASI算法仿真實驗25</p><p>  4.2.2 改進的自適應(yīng)盲分離算法仿真實驗

17、26</p><p>  4.3 兩種算法分離結(jié)果的對比分析28</p><p>  4.3.1串音誤差ECT的比較28</p><p>  4.3.2 信噪比SNR的比較29</p><p>  4.4 本章小結(jié)29</p><p>  5 總結(jié)與展望30</p><p><

18、b>  5.1 總結(jié)30</b></p><p><b>  5.2 展望31</b></p><p><b>  致謝32</b></p><p><b>  參考文獻(xiàn)33</b></p><p><b>  1 緒論</b>&

19、lt;/p><p><b>  1.1研究背景</b></p><p>  由于計算機技術(shù)的快速發(fā)展,社會逐步進入了數(shù)字化的時代。數(shù)字信號處理技術(shù)作為“后起之秀”很快在通信以及地震探測等多個領(lǐng)域得到了廣泛的應(yīng)用,而盲信號語音分離作為數(shù)字信號處理中的一種新興技術(shù)是最近二十年才發(fā)展起來的。</p><p>  20世紀(jì)末21世紀(jì)初,人類生活水平明顯提高

20、,因此對于新技術(shù)的要求也顯著提高。而盲信號的分離問題對于我們顯得尤為重要。同時在語音通信[1]、生物醫(yī)學(xué)、數(shù)據(jù)挖掘模式識別和聲納探測等各個領(lǐng)域中,盲源分離[2]的研究都具有非常重要的理論價值和實際意義。</p><p>  “雞尾酒會”問題就是一個典型的盲信號語音分離的例子,它可以表述為在眾多的談話和背景噪聲中,集中人們的聽力于某個談話者聲音上的能力。在酒會上,我們通過多個麥克風(fēng)采集到同時講話的人的語音信號和許多

21、噪聲信號,這些信號可以稱之為源信號;進而獲得多路混合的語音信號,為觀測信號;因為是由在不斷運動的人們發(fā)出的這些語音信號,所以混合信號的信道是無法確定的,這種僅利用源信號的統(tǒng)計特性和觀測信號恢復(fù)出每個人的語音的過程就是盲信號的語音分離[1]。如圖1-1所示。</p><p>  圖1-1 語音信號的盲分離示意圖</p><p>  在一大堆不同的信號中,我們可以忽略其他的干擾噪聲,僅僅根據(jù)自

22、己的喜好選擇出我們感興趣的信號來接受,這是一個有趣的問題。這種特殊的辨別能力也許是由人類發(fā)聲系統(tǒng)、聽覺系統(tǒng)或者更為高級的知覺和語言處理的特性所決定的,然而這些知識假設(shè),這種機制到底是由什么決定的,還需要我們?nèi)ミM一步的探索。</p><p>  盲源分離(Blind Source Spearation,BSS)所指的是在源信號和傳輸通道參數(shù)未知的情況下,根據(jù)源信號的統(tǒng)計特性,僅由觀測信號恢復(fù)出源信號各個獨立成分的過

23、程[3]。我們可以從盲源分離的概念中看出這里的術(shù)語“盲”有兩重含義,不知道源信號是如何混合的且傳輸通道的參數(shù)也是未知的[4]。</p><p>  1.2 國內(nèi)外研究現(xiàn)狀</p><p>  從語音分離[1]的角度看,語音信號盲分離算法的研究主要經(jīng)過了三個階段。第一個階段是盲信號語音分離理論的形成時期,這個時期的學(xué)者們致力于研究平穩(wěn)的語音信號的瞬時盲分離問題。第二個階段是上世紀(jì)九十年代中后

24、期,大家的目光開始轉(zhuǎn)移到非平穩(wěn)信號的瞬時語音分離[5]。第三個階段是從本世紀(jì)初至今,學(xué)者們漸漸關(guān)注研究卷積混合模型的語音信號分離。</p><p>  總的來說,盲信號語音分離問題的研究內(nèi)容大體上可以劃分為四部分:卷積混疊語音分離、瞬時線性混疊語音分離、語音分離的應(yīng)用和非線性混疊語音分離 [6]。到目前為止,在大多數(shù)的研究中,討論得最多的是瞬時線性混疊語音分離和卷積混疊語音分離。瞬時線性混疊語音分離代表性的算法主

25、要有:Bell-Sejnowski的最大信息量(Infomax)方法、Amari的自然梯度(Natural Gradient)方法、Cardoso的等變化自適應(yīng)方法(EASI)、Hyvarinen的快速獨立元分析算法(FastICA)、矩陣特征值分解方法等。其它的語音發(fā)呢里算法大都是在以上算法的基礎(chǔ)上推廣或者補充而發(fā)展起來的,當(dāng)然語音分離并不僅僅局限于這些算法。優(yōu)化算法經(jīng)常在語音分離中被使用,就優(yōu)化手法而言[2],Infomax算法、自

26、然梯度算法、和EASI算法屬于梯度下降(上升)尋優(yōu)算法,收斂速度是線性的,速度略慢一些,但屬于自適應(yīng)方法、具有實時在線處理能力;FastICA算法是一種快速而數(shù)值穩(wěn)定的方法,采用擬牛頓算法實現(xiàn)尋優(yōu),沒有迭代尋優(yōu)過程,因此運行速度最快。相比卷積混疊語音分離和瞬時線性混疊語音分離, 非線性混疊語音分</p><p>  其中獨立分量分析[8] (Independent Component Analysis, 簡稱IC

27、A) 是研究盲源分離問題過程中出現(xiàn)的一種新方法。所謂ICA, 就是要尋求一種線性變換, 使信號各個分量之間高階統(tǒng)計獨立性最大。典型的ICA 算法有Amari 等的自然梯度算法[9] , Cardoso 等的EASI 算法等, 離線算法有Lee T. W. 等人提出的擴展Infomax 算法[10] 和Hy varinen 的Fast ICA 算法[10]等。本文將研究用EASI算法解決盲信號語音分離問題。</p><

28、p>  例如,2000年,Parra提出了基于頻域去輸出信號相關(guān)性的算法,不僅得到了好的分離效果,而且算法的收斂速度也非???。總體上,這類文章可以分為兩部分:卷積后混合語音信號的盲分離和瞬時混合語音信號的盲分離。盲信號語音分離用于解決瞬時線性混合問題目前已經(jīng)有很成熟的算法而且也得到了很好的應(yīng)用。</p><p>  近些年來,我國有也有很多關(guān)于盲信號語音分離技術(shù)的文章相繼發(fā)表。</p><

29、;p>  我國也有許多的專家學(xué)者都致力于盲源分離的研究,已提出了許多的算法,這些算法大致分為幾種:</p><p>  2002年,蘇野平等人提出一種改進的基于高階累積量的盲信號分離算法[11]并且被用來進行雙路語音增強,并提出了最速下降法濾波器抽頭系數(shù)更新算法。模型和實際錄音的實驗表明所提出方法的有效性。</p><p>  2004年,桂國華,蔡青,賈鵬證明了當(dāng)源信號是非平穩(wěn)信號

30、是,使用二階統(tǒng)計計量[12]就足以成功地對混合信號進行盲分離,從而,大大簡化了計算的復(fù)雜度。據(jù)此,我們提出一種基于二階統(tǒng)計計量的盲分離算法,并在實驗中用此算法成功地分離了語音和音樂的混合信號。</p><p>  2005年,李立峰提出一種快速定點算法,該算法的特點是逐個分離出每一個源信號,并且收斂快,另外盲分離算法不僅能夠在主信號方向形成主波速,并且還可以在干擾信號方向形成零點,可以大大提高信噪比。</p

31、><p>  2005年,張雪峰等[13]提出對真實環(huán)境中的混疊語音信號進行盲分離是一個非常困難的任務(wù)。許多在仿真信號環(huán)境下工作很有效的算法常常不能成功地分離真實環(huán)境中錄取的混疊語音信號。</p><p>  2005年,金輝,陳曉署提出一種實用的語音分離算法-COBliss,它是一種基于二階統(tǒng)計量的多通道盲反卷積算法。但是源信號自相關(guān)函數(shù)的序列長度必須足夠大,而大多數(shù)語音信號不滿足這一要求。

32、</p><p>  2005年,肖俊等人在Torkkola提出的分析反饋分離算法[13]的基礎(chǔ)上,提出了一種在頻域上用前饋結(jié)構(gòu)的信息最大化算法,該算法對應(yīng)于非因果FIR濾波器,為非最小相位系統(tǒng)的盲分離問題提出了一個解決方案。最后,我們將演示用這種方法分離實際環(huán)境下的兩個自然信號。</p><p>  2005年,何文雪等利用模糊函數(shù)的時頻分布特征選取時頻點,提出一種新的時頻域語音信號分離

33、算法,與傳統(tǒng)的維納時頻分布相比,不但顯著縮小了時頻點的選擇范圍,而且不需要設(shè)定閾值。算法利用一種非正交聯(lián)合對角化方法求取分離矩陣,在原始信號既有相互相關(guān)的情況下也能達(dá)到良好的分離性能。仿真實驗表明,該算法難度小,分離精度高,可實現(xiàn)高斯源或相關(guān)源信號的盲分離。</p><p>  2007年,李雪霞等[5]提出了一種線性混合的混沌信號的瞬時盲信號分離方法,它利用了各個混沌信號源之間的互不相關(guān)性,在未知混合矩陣和混沌

34、方程的情況下,通過求解特征向量的方法從觀測中直接估計出解混合矩陣,以重構(gòu)出混沌信號。仿真結(jié)果表明,即使在低信噪比情況下,該方法仍可以有效地從噪聲背景中分離出多個混合的混沌信號。</p><p>  2007年,馬明等采用同倫分線性模型對語音信號進行建模,將非線性可預(yù)測性作為盲源分離的準(zhǔn)則,推到了基于同倫模型的盲源算法,成功的實現(xiàn)了語音信號的分離。</p><p>  2007年,李大輝等給

35、出了語音信號分離的數(shù)學(xué)模型,并確定了可分離的假設(shè)條件和分離準(zhǔn)則,通過分析2種學(xué)習(xí)規(guī)則長變化對分離效果的影響,提出改進的學(xué)習(xí)規(guī)則,應(yīng)用改進的學(xué)習(xí)規(guī)則實現(xiàn)自適應(yīng)算法對語音信號的盲分離,消除步長遞減過早或過晚的現(xiàn)象,分離效果好。</p><p>  1.3 研究的目的和意義</p><p>  在工程應(yīng)用和科學(xué)研究中,許多觀測信號能假設(shè)為源信號未知的混合,如:語音圖像信號、通信信號、雷達(dá)信號、生

36、物醫(yī)學(xué)信號、地震信號等等[2]。比如,大部分生物醫(yī)學(xué)信號[4]都是比較微弱的非平穩(wěn)信號,且容易受到噪聲干擾,所以通常都是相互層疊的。提取胎兒的ECG信號[1,4]就是從觀測信號中去除母親的心電信號和噪聲信號,然后從肺信號中分離出心臟信號。在通信系統(tǒng)中,對于接收端來說,從發(fā)射端發(fā)出的信號是未知的,且由于“移動”的原因,信道也在不斷變化[3],所以也是未知的,我們必須僅由接收信號去恢復(fù)原是信號本身。又比如在地震勘探中,震源信號和傳播信道都是

37、未知的,我們只有通過接收信號去確定地層信息。再如眾所周知的經(jīng)典的“雞尾酒會”的問題[5],在一個都是客人的房間里,每一個人都能聽到來自各個方向的不同種類的聲音,如音樂,歌聲以及人們的說話聲等等。而盲信號語音分離與傳統(tǒng)信號分離的方法最大的不同之處就在于用它可以用最少的信息得到理想的結(jié)果。</p><p>  總的來說,盲信號語音分離是一種僅僅利用觀測到的混合信號來估計源信號的方法,它是以獨立分量分析(Indepen

38、dent Component Analysis,ICA)[3]為理論基礎(chǔ)的。隨著數(shù)字信號處理理論和技術(shù)的發(fā)展以及相關(guān)學(xué)科的不斷深入,許多盲信號分離算法被不斷提出,使盲信號分離問題逐漸成為當(dāng)今信息處理領(lǐng)域中最熱門的研究課題之一。而我們所要研究的盲信號語音分離技術(shù)雖然不可能讓計算機變得具有和人類一樣的聽覺,但是此項技術(shù)卻能使相互混疊的語音信號變成相互剝離的語音信號,這樣可以作為語音識別技術(shù)的預(yù)處理技術(shù),從而使得在吵鬧的環(huán)境中混有很多的說話聲

39、音的情形下,不同人的說話聲音可提取出來,即語音分離技術(shù)成為了可能。這樣就增大了識別算法的魯棒性[14]和適應(yīng)能力。但是意義不僅限于此,因此,近年來由于實際應(yīng)用的需求使得混合語音信號分離成了信號處理、移動通信和神經(jīng)網(wǎng)絡(luò)、無線通信、圖像處理、地震信號處理、陣列信號處理[15]和生物醫(yī)學(xué)信號處理等領(lǐng)域得到了廣泛的應(yīng)用。</p><p>  1.4 本文的主要內(nèi)容及工作安排</p><p>  本

40、文在論述安排上主要分為以下幾個部分:</p><p>  第一章 簡要介紹盲信號語音分離的研究背景和國內(nèi)外現(xiàn)狀以及本課題的主要研究目的和意義。</p><p>  第二章 概要介紹了語音信號的主要特征和盲信號語音分離的模型,闡述了語音分離的研究內(nèi)容和研究方法,包括獨立分量分析的方法,獨立分量的發(fā)展史,獨立分量的約束條件,獨立分量的理論基礎(chǔ)和獨立分量分析的不同的優(yōu)化算法。</p>

41、<p>  第三章 詳細(xì)介紹了盲信號語音分離中基于獨立分量分析的傳統(tǒng)的EASI算法,分析了傳統(tǒng)EASI算法的串音誤差ECT,并說明了步長因子對穩(wěn)態(tài)性的影響。進而提出了一種新的算法,改進的自適應(yīng)盲分離算法,并對其串音誤差、步長因子和穩(wěn)態(tài)性進行了分析,介紹了新算法的流程,以及新算法的優(yōu)點。</p><p>  第四章 用matlab進行仿真實驗,對數(shù)據(jù)進行分析。</p><p>

42、  第五章 總結(jié)全文,指出自己所做工作以及設(shè)計和論文需要進一步改進的地方。</p><p>  2 盲信號語音分離的概要研究</p><p>  對于ICA研究最初是雞尾酒會的問題,也是盲信號語音分離的起點。ICA是從多維統(tǒng)計數(shù)據(jù)中找出分量和隱含因子 [15]的方法。從線性變換角度來看,源語音信號是非高斯信號且相互獨立,可以當(dāng)作線性空間[16]的基礎(chǔ)信號,那么觀測信號即混合后的語音信號就是

43、源信號的線性組合,ICA就是在傳輸信道和源語音信號均未知的情況下,從觀測號中估計出源語音信號的過程。因為盲信號分離是語音分離的主要方法,所以我們可以把盲源分離問題轉(zhuǎn)化為語音分離的問題。</p><p>  2.1語音信號的概述</p><p>  2.1.1語音的特性</p><p><b>  (1)短時平穩(wěn)性</b></p>

44、<p>  根據(jù)學(xué)者們對語音信號的研究,發(fā)現(xiàn)語音是一種時變的、非平穩(wěn)的隨機過程,另一方面,我們認(rèn)為在很短的時間內(nèi)語音的特征是不會改變的,因為人類的發(fā)聲系統(tǒng)的生理結(jié)構(gòu)和其變化速度是有一定限度的,所以語音的短時性特點是對語音信號進行處理和分析的基礎(chǔ)。</p><p><b> ?。?)清音和濁音</b></p><p>  語音可分為清音和濁音。二者從語音產(chǎn)生的

45、機理上有明顯的差異,前者為周期性脈沖產(chǎn)生的,后者由隨機噪聲產(chǎn)生的,因此在特征方面的區(qū)別也很明顯。且清音類似于白噪聲。</p><p>  2.1.2語音信號的特征</p><p><b> ?。?)時域特征</b></p><p>  由前面的分析可知,語音信號是時變的,且具有短時平穩(wěn)性。因此可知,語音信號在時域上存在有音段和無音段。因此,通過

46、對有音段和無音段的特性檢測,可以去除噪聲語音中的平穩(wěn)噪聲。</p><p><b>  (2)頻域特征</b></p><p>  眾所周知,語音信號的頻譜能量大多集中在300-3400Hz。其中大部分能量是濁音信號,其頻譜注意集中在低頻段和各次諧波上,具有明顯的周期性;而清音是隨機的,在頻譜上類似白噪聲。</p><p><b> 

47、?。?)統(tǒng)計特征</b></p><p>  語音信號可以看作為一個隨機過程的樣本函數(shù),它的統(tǒng)計特性可以用概率密度函數(shù)來描述。</p><p>  由于語音信號具有以上特征,因此我們可以把語音信號的頻譜圖當(dāng)作源信號,所以,可以把盲源分離的模型轉(zhuǎn)換為語音分離模型。</p><p>  2.2 語音分離的數(shù)學(xué)模型</p><p>  

48、由上可知,盲信號分離是語音分離的主要方法。盲信號分離(BSS)是指源信號、傳輸通道特性未知的情況下,僅由觀測信號和源信號的一些先驗知識(如概率密度)估計出源信號各個分量的過程。所謂“盲”包含兩個方面,源信號不可觀測和混合系統(tǒng)的特性事先未知。</p><p>  本文討論的盲信號語音分離算法是基于線性瞬時混合的,其基本數(shù)學(xué)模型如圖2-1所示。</p><p>  圖2-1 語音分離示意圖&l

49、t;/p><p>  那么語音分離問題可以用下面的公式來表示:</p><p><b>  (2-1)</b></p><p>  其中 是由個未知語音信號 , 構(gòu)成的列向量, 是由個觀測向量即混合語音信號 構(gòu)成的列向量,為一個 階的混合矩陣, 是由個白色,高斯,統(tǒng)計獨立的噪聲信號 構(gòu)成的列向量。式(2-1)也可以寫成矩陣形式,即:</p&g

50、t;<p>  在混合矩陣和源語音信號 均未知的情況下,若想盡可能真實的分離出源語音信號 ,則可構(gòu)建一個分離矩陣,那么 經(jīng)過分離矩陣變換后,即 ,其中, 為輸出列向量, 是源語音信號的估計。</p><p>  2.3語音分離的研究內(nèi)容</p><p>  對于語音信號的分離來說,一般是選擇一個目標(biāo)函數(shù),根據(jù)特定的判斷依據(jù),調(diào)整某些參數(shù)如分離矩陣或者步長因子,使我們選擇的目標(biāo)

51、函數(shù)最接近或者達(dá)到極值。而這個調(diào)整參數(shù)的過程,我們是可以通過迭代的方法來實現(xiàn)的,整個過程的細(xì)節(jié)都會直接影響語音分離結(jié)果的精確程度和穩(wěn)定性能。所以語音信號盲分離要研究的內(nèi)容包括對源語音信號的概率密度函數(shù)的估計,優(yōu)化算法準(zhǔn)則,選取合適的目標(biāo)函數(shù),和分離算法的評價指標(biāo)等。</p><p><b> ?。?)優(yōu)化算法準(zhǔn)則</b></p><p>  目前,在語音信號分離的算法

52、中,一般都需要使得輸出的語音信號的各分量間的獨立性最大,所以我們研究的優(yōu)化算法準(zhǔn)則要達(dá)到這個目的。信息散度,負(fù)熵,互信息量等都可以用來衡量語音信號的獨立性。</p><p> ?。?)對源語音信號的概率密度函數(shù)進行估計</p><p>  語音分離的很多算法中都需要知道源語音信號的概率密度函數(shù),但這是不可能的。因為盲信號語音分離中“盲”就是源語音信號不可觀測的。所以我們只能對混合的語音信號

53、即觀測語音信號進行分析,估計出源語音信號的概率密度函數(shù)。</p><p><b> ?。?)目標(biāo)函數(shù)</b></p><p>  語音分離的目標(biāo)就是使分離后的語音信號彼此盡量相互獨立。所以,不同的語音分離效果主要體現(xiàn)在對目標(biāo)函數(shù)的選取上面。目標(biāo)函數(shù)的選擇決定了算法的統(tǒng)計特性。一般的目標(biāo)函數(shù)主要有基于極大似然估計的目標(biāo)函數(shù),基于互信息量最小化的目標(biāo)函數(shù)等。 </p

54、><p>  (4)語音分離的評價指標(biāo)</p><p>  一般情況下,如果要考察一個語音分離算法的性能,可以從語音分離所需的時間、分離出語音的效果、算法的穩(wěn)定性能和對資源的占用情況進行分析。</p><p>  2.4語音分離的研究方法</p><p>  2.4.1 獨立分量分析</p><p>  盲信號語音分離的最

55、主要的分析方法是獨立分量分析(independent component analysis, ICA)方法,顧名思義,就是把信號分解成若干個相互獨立的成分。ICA是屬于語音分離的一種方法[16]。它是利用高階統(tǒng)計工具和信息論的知識分析信號的統(tǒng)計獨立性以實現(xiàn)語音信號的盲分離。</p><p><b>  一、ICA的發(fā)展史</b></p><p>  ICA的發(fā)展是這樣

56、一個過程[1][17]:80年代早期,該方法由J.Herault,C.Jutter與B.Ans提出來。該問題首次出現(xiàn)在1982年的神經(jīng)生理學(xué)框架中。在80年代中期,國際性的神經(jīng)網(wǎng)絡(luò)會議上很少有ICA呈文。但在1991年C.Jutten和J.Herault首創(chuàng)將人工神經(jīng)網(wǎng)絡(luò)算法用于BSS問題[15],開啟了一個新領(lǐng)域。雖然他們的學(xué)習(xí)算法沒有明確指出需利用觀察信號的高階(高于二階)統(tǒng)計信息[16],但是其迭代計算公式已具備后來算法的雛形;1

57、994年,P.Comon首先界定了解決BSS問題的ICA方法的基本假設(shè)條件(ICA這個名稱就是由他提出的)[17]。他明確指出,我們應(yīng)該通過讓某個稱為對比函數(shù)(contrast function)的目標(biāo)函數(shù)達(dá)到極大值[18]來消除觀察信號中高階統(tǒng)計的關(guān)聯(lián)問題,從而實現(xiàn)盲源分離BSS。1995年,A.J.Bell和T.J.Sejnowski發(fā)表的有關(guān)文獻(xiàn)是ICA分析研究的熱潮的起點。并且證明了ICA是一種解決BSS問題的簡單、高效的算法,

58、因而帶起了一大批后續(xù)的研究工作;1996年,B.A.Pearlmutter在ICA中引入了目標(biāo)函數(shù):最</p><p>  二、ICA的約束條件</p><p> ?。?)各個源語音信號之間是相互統(tǒng)計獨立的。若 的概率密度函數(shù)為 ,則源語音信號的聯(lián)合概率密度函數(shù)(即矢量的pdf)為:</p><p><b>  (2-2)</b></p&

59、gt;<p>  信號源獨立的假設(shè)是比較合理的,因為只要發(fā)出信號的源語音在物理上是相互分離的[13],彼此間不交換信息,那么我們就認(rèn)為它們產(chǎn)生的源語音信號是相互獨立的。</p><p> ?。?)觀測信號即混合語音的個數(shù)必須大于等于源信號的個數(shù),即 。此假設(shè)條件是為了保證混合矩陣是滿秩的且逆矩陣 存在。因為當(dāng)M<N時,為欠定混合(underdetermined mixture)情況,此時的盲語

60、音分離的問題就變?yōu)椴缓媒鉀Q的問題,這種情況下必須對源語音信號做出更多的假設(shè)才能分離出部分或全部源語音信號,本文不討論這種情況。</p><p> ?。?)最多只能允許一個源語音信號是高斯分布的。這是因為兩個統(tǒng)計獨立的高斯信號混合以后還是高斯信號[15],而高斯信號分布的統(tǒng)計特性用均值和方差就可以確定,不涉及到高階的統(tǒng)計參數(shù),那么它們的獨立性等于互不相關(guān)。由Darmois-Skitovich定理可知,任意變換 (為

61、分離矩陣,即 )分離后得到的結(jié)果都不會改變高斯向量的二階不相關(guān),也就是說,分離后的結(jié)果總是符合統(tǒng)計獨立性的要求的。顯然,這種結(jié)果與源語音信號不可能總是一致的。因此,若服從高斯分布的源語音信號超過一個,則各源語音信號不可分。</p><p> ?。?)各傳感器引入的噪聲很小,可以忽略不計。這時盲信號語音分離的模型可用式 來描述。對于噪聲比較大的情況,可將噪聲本身也可以看做一個源信號,對它與其他“真正的”源語音的混合

62、信號進行盲分離處理,從而使算法具有更廣泛的適用范圍和更強的穩(wěn)健性。</p><p> ?。?)求解ICA問題,需對各個源語音信號的pdf有一些先驗知識[8]。例如,自然界的語音和某些音樂信號具有超高斯特性,如拉普拉斯分布,這種分布函數(shù)中心部分又窄又高,而尾部拖得很長,如圖2-2中曲線 所示;圖像信號大多具有亞高斯特性,如均勻分布,這種分布函數(shù)中心部分較寬,尾部很短,如圖中曲線③所示;許多噪聲則具有高斯特性,當(dāng) 為

63、多個隨機變量之和且變量數(shù)很多時, 也趨近于高斯分布,如途中曲線①所示。</p><p>  圖2-2高斯、超高斯、亞高斯pdf</p><p>  2.4.2 對源語音信號的概率密度函數(shù)進行估計</p><p><b>  (1)相對熵[6]</b></p><p>  假設(shè)對同一個隨機矢量,有兩種可能的概率分布和。為了

64、衡量這兩個分布之間的差別,則我們需要定義相對熵(或稱作“Kullback-Leibler距離”)。連續(xù)的相對熵定義為:</p><p><b> ?。?-3)</b></p><p>  雖然和當(dāng)且僅當(dāng)時成立,但是相對熵并非一個真正的度量,因為在把互相交換時,我們會發(fā)現(xiàn)并不具有對稱性。</p><p><b>  (2)負(fù)熵[9]&l

65、t;/b></p><p>  在概率論中,我們知道,在中心極限定理中:一定條件下,多個獨立分布的和趨于高斯分布。將這個理論應(yīng)用到ICA的問題中可以得出這樣的結(jié)論:若觀測信號即混合語音信號是多個獨立源語音信號的線性組合,那么觀測信號即混合語音信號的高斯性比源語音信號的高斯性強。這就啟示我們可以將非高斯性作為ICA的一個判斷依據(jù)。</p><p>  在定義負(fù)熵之前先介紹一個定理,熵極

66、大定理:在所有的具有相同協(xié)方差矩陣的分布中,高斯分布的熵最大。</p><p>  這個定理說明:在一定的條件下,我們可以找到一個分布具有最大的信息熵。而這個分布就為是高斯分布。所以我們會產(chǎn)生這樣一個想法,如果以高斯分布作為參考標(biāo)準(zhǔn),我們就可以用信息熵來衡量一個分布與高斯分布之間的偏離程度,即非高斯性。所以,負(fù)熵可定義為:</p><p><b>  (2-4)</b>

67、;</p><p>  其中是一個與具有相同的協(xié)方差的高斯聯(lián)合概率密度。由上述定理我們可以得出負(fù)熵具有這樣的性質(zhì):若,當(dāng)且僅當(dāng)也是高斯分布時等號成立。</p><p>  負(fù)熵有一個重要的性質(zhì),就是對于可逆的線性變換保持不變。在ICA中,因為有了該性質(zhì),我們可以將邊緣負(fù)熵作為一個代價函數(shù),然后尋找線性變換使其最大化。因此可得出ICA算法中負(fù)熵判據(jù)的有效性。</p><p

68、> ?。?)互傳信息量[7]</p><p>  互信息(Mutual Information,簡稱MI)是用來度量隨機變量之間獨立性的基本準(zhǔn)則。多個隨機變量之間的互信息定義為其聯(lián)合概率密度函數(shù)與各邊緣密度函數(shù)乘積之間的K-L散度,即:</p><p><b> ?。?-5)</b></p><p>  由K-L散度的非負(fù)性可知:<

69、/p><p><b> ?。?-6)</b></p><p>  由(2-4)式,我們?nèi)菀卓闯?,?dāng)中的各個語音分量相互獨立時,互信息。再結(jié)合(2-6)式,我們得出了一個重要結(jié)論:當(dāng)且僅當(dāng)各個語音分量相互獨立時等號成立?;バ畔⒖梢悦枋鰹橛捎诟鱾€語音分量之間的相互依賴關(guān)系帶來的信息的冗余。所以互信息也可以用來度量獨立性。</p><p>  2.4.3

70、 目標(biāo)函數(shù)的選取和優(yōu)化算法</p><p>  ICA的處理過程實際上是為了使分離出的獨立分量[4]最大程度地逐步逼近各個源信號 ,即ICA的目標(biāo)就是通過變換 ,由觀測信號向量求得源信號向量。為此,我們需要設(shè)立一個目標(biāo)函數(shù) ,如果 能使之達(dá)到極大(?。┲?,則 即為所需解,使得 與 相對應(yīng)。在這部分將給出相關(guān)的數(shù)學(xué)知識和從不同視角出發(fā)得到的目標(biāo)函數(shù)。</p><p>  從以上的介紹中可以知

71、道使整個系統(tǒng)的輸出信號相互獨立是ICA的主要目標(biāo)。因此,不同的ICA算法的不同主要體現(xiàn)為目標(biāo)函數(shù)的優(yōu)化算法和獨立準(zhǔn)則的衡量。故而ICA算法可以用下式表述:</p><p>  ICA算法=目標(biāo)函數(shù)+優(yōu)化算法</p><p>  其中,不同的目標(biāo)函數(shù)就有不同的優(yōu)化算法。所以目標(biāo)函數(shù)的選取很重要。而優(yōu)化算法會影響ICA的收斂速度等,常見的優(yōu)化算法主要有牛頓迭代法、梯度下降法等。因此,ICA算法

72、的性能是目標(biāo)函數(shù)的選擇同優(yōu)化算法的選擇之間的結(jié)合。</p><p>  下面給出按照不同的目標(biāo)函數(shù)所相應(yīng)的分離準(zhǔn)則給出不同的ICA算法。</p><p> ?。?)非高斯性極大[1][13]</p><p>  ICA方法必須的前提條件是非高斯性的存在,如果隨機變量都是高斯分布,那么ICA方法也就沒有研究的必要。其實基于非高斯性極大的ICA思想來自于中心極限定理。因

73、此,如果觀測信號是多個獨立源的線性組合,那么觀測信號比源信號更接近高斯分布,或者說源信號的非高斯性比觀測信號的非高斯性要強。我們可以根據(jù)上述對分離結(jié)果的非高斯性進行度量,當(dāng)其非高斯性達(dá)到最大時,可以認(rèn)為實現(xiàn)最佳分離。</p><p>  對于零均值,單位方差的隨機變量,可表示為:</p><p><b> ?。?-7)</b></p><p>

74、  在現(xiàn)實世界中,亞高斯和超高斯信號都是普遍存在的。比如:自然景物圖象大多為亞高斯信號,語音信號大都是超高斯信號,生物醫(yī)學(xué)信號既有超高斯分布又有亞高斯分布。</p><p> ?。?) 互信息最小[1][13]</p><p>  我們知道隨機變量獨立性的準(zhǔn)則是用互信息度量的?;バ畔⑼ǔJ欠秦?fù)的,但當(dāng)變量相互獨立時,互信息就是0。所以可以用和之間的散度來度量各分量的統(tǒng)計獨立性。這一量也稱為

75、各分量間的互信息,并表示為,即有:</p><p><b>  (2-8)</b></p><p>  可以看到,,的各分量統(tǒng)計獨立,這三種表述是等價的。所以互信息也可以用來度量獨立性。</p><p> ?。?) 非線性不相關(guān)[1][13]</p><p>  由上述統(tǒng)計知識可知,對于統(tǒng)計獨立的源信號,具有可分的聯(lián)合概

76、率密度函數(shù),則若隨機變量是相互獨立的,則其任意階聯(lián)合矩也是可分的。假設(shè)有兩個相互獨立的源信號,,則有:</p><p><b> ?。?-9)</b></p><p>  式中和是兩個非線性函數(shù)。由上式可知,若隨機變量是非線性不相關(guān)的,則表示它們相互獨立。因此在ICA的輸出端引入非線性環(huán)節(jié)來表示輸出結(jié)果的獨立程度,如圖2-3,分離結(jié)果的獨立性可由非線性輸出的協(xié)方差矩陣

77、來表示。顯然,若輸出向量的各分量是相互獨立的,則其協(xié)方差矩陣和輸出的都是對角矩陣,它的也是對角矩陣。</p><p>  圖2-3 帶有非線性環(huán)節(jié)的分離模型</p><p>  分離結(jié)果獨立性的可用非線性不相關(guān)度量。差別在于選擇的非線性函數(shù)的不同,但本質(zhì)上都是利用了隨機變量的高階統(tǒng)計特性來進行盲信號語音分離,以實現(xiàn)最佳的分離結(jié)果。</p><p>  2.4.4 語

78、音分離的評價指標(biāo)</p><p><b> ?。?)串音誤差</b></p><p>  為了以后查看實驗結(jié)果[21],本文在此處引入一個分離算法分離效果的檢驗方法。定義了一個混合-分離矩陣C,使混合-分離矩陣是一個廣義排列矩陣即可。然而時間上盲分離算法只能使混合-分離矩陣盡量接近一個廣義排列矩陣。所以,可以利用混合-分離矩陣和廣義排列矩陣之間的差別作為分離效果的評價

79、指標(biāo)是一個好辦法。所以定義串音誤差ECT:</p><p><b> ?。?-10)</b></p><p>  其中, 為矩陣 的第 行第 列的元素。 的下界為0。如果 越小,則分離的效果越好。下圖2-4為ECT的流程圖。</p><p>  圖2-4 ECT的流程圖</p><p> ?。?)信噪比(Signal N

80、oise Ratio , SNR)</p><p>  最直觀的一種評價語音分離性能的方法就是計算分離后的語音信號的信噪比,即分離后的語音信號和源語音信號的差別。一般來說,分離后的信噪比越高說明算法的分離性能越好,否則相反。其計算公式如下:</p><p><b> ?。?-11)</b></p><p>  式中 是源語音信號, 是對源語音信

81、號的估計信號。</p><p>  2.4.5 ICA數(shù)據(jù)的預(yù)處理</p><p>  通常為了讓混合后的語音信號,即觀測信號更好的符合ICA的基本假設(shè)條件,我們要對觀測信號即混合語音信號進行適當(dāng)?shù)念A(yù)處理。預(yù)處理方法通常有中心化、白化和濾波器處理等等,中心化和白化也統(tǒng)稱標(biāo)準(zhǔn)化。</p><p> ?。?)中心化(centering)</p><

82、p>  中心化是對混合后的語音信號即觀測信號去均值。設(shè)觀測矢量為,而的均值為: ,中心化則為: 。中心化后的源語音信號也是零均值向量。</p><p> ?。?)白化處理(whitening)</p><p>  白化處理是ICA算法中一個經(jīng)常用到的預(yù)處理方法,對于某些ICA算法,白化還是一個必須的預(yù)處理過程。</p><p>  眾所周知,不相關(guān)是獨立的必要

83、條件,而不是充分條件。相互獨立的源信號 肯定是不相關(guān)的,若使獨立源的能量進行歸一化處理, 相當(dāng)于源信號 的自協(xié)方差矩陣是單位矩陣:</p><p><b> ?。?-12)</b></p><p>  當(dāng)源語音信號均值為零時,獨立源語音信號的自協(xié)方差矩陣等于自相關(guān)函數(shù)矩陣 。將滿足式(2-12)的源語音信號稱為空域白化信號(或簡稱白化信號)??梢钥闯?,白化信號既要求能

84、量歸一化又要求不相關(guān),即歸一化的不相關(guān)。</p><p>  對任意多維混合語音信號加一個線性變換,使其變?yōu)榘谆盘柕奶幚磉^程叫做歸一化解相關(guān)或白化處理,則相應(yīng)的變換矩陣為白化矩陣。若為混合語音信號即觀測信號 的白化矩陣,則:</p><p><b> ?。?-13)</b></p><p>  是經(jīng)過白化后的混合語音信號,于是有 。再將 代入

85、式(2-13)并令 ( 為全局混合矩陣),得:</p><p><b> ?。?-14)</b></p><p>  由于線性變換 所連接的 和 是兩個隨機向量,則矩陣 一定是正交矩陣,如果把 看作新的觀測信號即混合語音信號,那么白化就是使原來的混合矩陣轉(zhuǎn)化成一個新的正交矩陣 ,類似地,若分離矩陣 針對的是白化后的混合語音信號 ,分離輸出 滿足 時,有:</p

86、><p><b> ?。?-15)</b></p><p>  式(2-15)表明,數(shù)據(jù)經(jīng)過白化后的盲信號語音分離,其分離矩陣 必然為正交矩陣。</p><p>  對于多維信號來說,白化后的混合矩陣 是 階正交矩陣,其自由度降為 ,因此白化使得ICA問題的工作量幾乎減少了一半。白化處理這種常規(guī)方法作為ICA盲信號語音分離的預(yù)處理可以有效的降低問題

87、的復(fù)雜程度,但值得注意的是,某些ICA算法不需要白化預(yù)處理,因為白化過程已經(jīng)包含在語音分離算法自身當(dāng)中,可以直接經(jīng)過迭代估計出分離矩陣 。</p><p>  進行白化處理的另一種方法就是迭代,因為白化的目的是尋找一個白化矩陣使得變換以后的矢量相關(guān)矩陣是單位陣,因此令 ,通過下式的迭代,不斷調(diào)整矩陣 的各個元素值,逐步縮小 的相關(guān)矩陣和單位矩陣 之間的“距離”。迭代方法如下:</p><p&

88、gt;<b> ?。?-16)</b></p><p>  其中 是學(xué)習(xí)系數(shù),可以是適當(dāng)?shù)某?shù),也可以是隨時間變化的參數(shù)。</p><p>  可以看出,當(dāng)式(2-16)的迭代算法收斂以后,將有: ,即 ,則實現(xiàn)了對于混合信號的預(yù)白化。白化的流程如下圖2-5所示:</p><p>  圖2-5 白化處理的流程圖</p><p

89、>  2.5盲信號語音分離的主要流程</p><p>  從上幾節(jié)的內(nèi)容可知,盲信號語音分離的主要流程主要可分為一下幾部:</p><p> ?。?)輸入一個混合后的語音信號并對其進行預(yù)處理;</p><p> ?。?)確定一個優(yōu)化算法準(zhǔn)則來衡量語音信號的獨立性;</p><p> ?。?)根據(jù)上面的準(zhǔn)則和混合后的語音信號,對源語音信號

90、的概率密度函數(shù)進行估計;</p><p> ?。?)選擇一個目標(biāo)函數(shù);</p><p> ?。?)結(jié)合目標(biāo)函數(shù)和對源語音信號概率密度函數(shù)的估計,對混合后的語音信號進行分離;</p><p> ?。?)把分離后的語音信號和源語音信號進行對比,看分離效果是否合理。</p><p>  具體流程如2-6圖所示:</p><p&g

91、t;  圖2-6 盲信號語音分離的流程圖</p><p><b>  2.6 本章小結(jié)</b></p><p>  在這一章中我們首先介紹了語音信號的特征,然后介紹了語音信號的分離模型即盲信號分離的模型。然后詳細(xì)講述了盲信號語音分離的研究內(nèi)容和研究方法。包括最基礎(chǔ)的獨立分量分析方法,優(yōu)化算法的準(zhǔn)則,對源語音信號的概率密度函數(shù)的估計,目標(biāo)函數(shù)的選取和優(yōu)化算法、分離性能指

92、標(biāo)和對混合語音信號的預(yù)處理。明確的說明了要進行語音信號分離的流程。</p><p>  3 盲信號語音分離的詳細(xì)設(shè)計</p><p>  3.1 傳統(tǒng)的EASI算法分析</p><p>  ICA算法是在沒有任何約束條件下得到的,它只能保證 是收斂的,并不能保證 是正交的。但是我們希望最后得到的分離矩陣 是正交的,因此,在1996年,cardoso和Laheld提出

93、了著名的基于獨立分量分析思想的自適應(yīng)[20]盲分離算法EASI。如下圖3-1所示,為EASI算法模型。</p><p>  圖3-1 EASI算法模型</p><p>  3.1.1 EASI算法</p><p>  假設(shè)信號源 和觀測信號 的均值已經(jīng)進行了中心化處理,且觀測信號也經(jīng)過了白化處理,因為 , ,所以只要考慮正交矩陣 就好,此時 ,則:</p>

94、;<p><b> ?。?-1)</b></p><p>  因為假設(shè)數(shù)據(jù)經(jīng)過了白化處理,那么分離矩陣 的自然梯度算法為:</p><p><b> ?。?-2)</b></p><p>  因為在每一步迭代中,分離矩陣 近似正交,所以有 ,則上面的算法簡化為下列形式:</p><p>

95、;<b> ?。?-3)</b></p><p>  實際上由于 是傾斜對稱的,白化處理可以與信號的分離同時進行。如此,這樣的算法就成為EASI(Equivariant Adaptive Separation based ICA)算法。其公式為:</p><p><b> ?。?-4)</b></p><p>  在實際語

96、音信號盲分離中,還有批處理的方法,這時就不用瞬時值而是通過時間的平均值來實現(xiàn)分離。</p><p>  3.1.2 算法的流程</p><p>  通過前面的分析,我們得到了EASI算法,而下面我們從另一個角度來分析EASI算法。</p><p>  假設(shè)所有源信號都是零均值,方差為1的隨機變量,即源信號的自相關(guān)矩陣是單位矩陣:</p><p&g

97、t;  設(shè)Q為白化矩陣,則有:</p><p><b> ?。?-5)</b></p><p>  其中, 。當(dāng)觀測信號被白化以后,有 ,所以對下面的代價函數(shù)進行優(yōu)化就可以實現(xiàn)混合信號的白化:</p><p><b> ?。?-6)</b></p><p>  顯然,當(dāng)且僅當(dāng) 時有 。再由前面信息論

98、知識以及輸出信號互信息最小化可知,因為 為正交矩陣,所以可知: </p><p><b> ?。?-7)</b></p><p><b>  一般初始化 ,有:</b></p><p><b> ?。?-8)</b></p><p

99、>  同時要保證觀測信號 是白化的,則要加一個約束條件,根據(jù)之前介紹的白化方法,有下式:</p><p><b> ?。?-9)</b></p><p>  上式兩端同乘 ,則也可得式(3-4)。</p><p>  EASI算法可以簡化成下圖3-2的流程:</p><p>  圖3-2 EASI算法流程圖<

100、;/p><p>  圖3-2 EASI算法的流程圖</p><p>  3.1.3 串音誤差ECT</p><p>  下圖3-3為傳統(tǒng)EASI算法的ECT圖。</p><p>  圖3-3 傳統(tǒng)EASI算法的ECT</p><p>  從串音誤差ECT收斂曲線可以看出,在使用2000個左右樣本就已經(jīng)處于穩(wěn)定狀態(tài)了,之和

101、一直在1.7左右震蕩,而不能繼續(xù)向0靠近。這說明:步長太大,可能會不利于收斂。</p><p>  3.1.4 算法中的步長因子u</p><p>  EASI算法的穩(wěn)定性條件是在假設(shè)步長因子很小且算法在平衡點處的性能,然而在自適應(yīng)算法中,步長因子是非常重要的參數(shù),它影響算法的收斂速度和最終的穩(wěn)態(tài)性能,因此有必要分析步長因子對整個算法的影響。得出結(jié)論,由于EASI算法采用的是固定步長,所以

102、隨著步長的增大,穩(wěn)態(tài)誤差就會越大,這樣分離處理的信號與源信號的符合程度就會變差。</p><p>  3.2 改進的自適應(yīng)盲分離算法</p><p>  在EASI算法中步長參數(shù)的作用就是在每一步迭代過程中,控制分離矩陣 各元素更新的幅度。步長參數(shù)的合理選擇對算法的性能至關(guān)重要,一般采用固定步長的盲分離算法會限制收斂速度或者導(dǎo)致分離算法會有較差的穩(wěn)定性。任何自適應(yīng)系統(tǒng)調(diào)整參數(shù)的目的都是為了

103、達(dá)到如下兩個性能的最佳結(jié)合:(1)收斂速度;(2)穩(wěn)態(tài)誤差。因此,我們對步長的任何改進目的都是為了增加步長到一個大的穩(wěn)定值以便達(dá)到最快的收斂,當(dāng)進入最佳收斂點是,我們就需要相應(yīng)的減少步長從而提高穩(wěn)定性能。分離矩陣 收斂于一定的穩(wěn)定領(lǐng)域,而不是收斂于一個固定的值。</p><p>  3.2.1 改進算法的分析</p><p>  基于上面的論述,我們考慮利用分離矩陣 離最佳分離矩陣 的距離

104、來進行步長自適應(yīng)的調(diào)整。由于 事先我們并不知道,所以只能用一種類似的方法來控制。如下式所示 , 其中 為Frobenius范數(shù)。實際上由于收斂狀態(tài)會不時地抖動,會使得 出現(xiàn)比較大的波動,所以無法用 來直接控制步長因子來保證分離矩陣穩(wěn)定的收斂于 。所以,我們采用了平滑的 ,即為 來代替 進行步長因子的自適應(yīng)調(diào)整。</p><p>  在選取合適的步長時,需要注意一個原則,在自適應(yīng)的過程中,如果 增大,則說明步長太

105、大,會出現(xiàn)抖動現(xiàn)象,需要減小步長;相應(yīng)地,如果 減小的程度超出了基本范圍,則說明還沒有達(dá)到最佳的分離矩陣 ,為了加快收斂速度,我們需要加大步長。</p><p>  在以上理論分析的基礎(chǔ)上,我們選擇了下式為步長因子: (3-11)</p><p>  從上

106、式(3-11)中我們可以很容易地的看出來,當(dāng) 增加時, ,從而步長因子 平滑的減小,相應(yīng)地,當(dāng) 減少時, ,從而步長因子 相應(yīng)的增加。</p><p>  由于 無法事先得知,我們可以采用下式方法來求得:</p><p><b> ?。?-12)</b></p><p>  綜上所述,根據(jù)自適應(yīng)步長的調(diào)整方案,改進的自適應(yīng)盲分離算法如下:<

107、;/p><p><b> ?。?-13)</b></p><p>  3.2.2 改進的自適應(yīng)盲分離算法的流程</p><p>  下圖3-4所示為改進的自適應(yīng)分離算法的流程圖:</p><p>  圖3-4 改進的自適應(yīng)分離算法流程圖</p><p>  3.2.3 改進算法的串音誤差ECT<

108、/p><p>  改進的自適應(yīng)盲分離算法的ECT為圖3-5:</p><p>  圖3-5 改進的自適應(yīng)盲分離算法的ECT</p><p>  改進的自適應(yīng)盲分離算法的ECT曲線表現(xiàn)和設(shè)計預(yù)想完全一致。既能在初期快速下降,又能在最后避免震蕩,得到一個很好很穩(wěn)定的值。</p><p><b>  3.3 本章小結(jié)</b><

109、;/p><p>  本章主要了研究自適應(yīng)盲分離算法,首先詳細(xì)地介紹了傳統(tǒng)的EASI算法,并分析了EASI算法的串音誤差ECT,揭示了步長因子會影響該算法的局部穩(wěn)定性。因為傳統(tǒng)的EASI算法的步長因子是固定的,所以穩(wěn)定性能和收斂速度不能很好的統(tǒng)一。為此,我們提出了一種改進的步長自適應(yīng)盲分離算法,它的步長是根據(jù)分離的程度自適應(yīng)變化的,故可以將收斂速度和穩(wěn)定性能進行比較好的結(jié)合起來。</p><p>

110、;  4 盲信號語音分離算法的仿真實驗</p><p>  由第二章可知,因為語音信號的統(tǒng)計特征與盲信號分離中源信號的統(tǒng)計特征類似,即可以認(rèn)為語音信號分離為盲源分離的一個特例。故可以把語音信號的分離問題轉(zhuǎn)化到盲信號的分離問題中來解決。本文兩種盲信號語音分離的算法進行了仿真實驗,并對分離性能作出比較,發(fā)現(xiàn)改進的自適應(yīng)盲分離算法的分離效果優(yōu)于EASI算法。</p><p>  4.1 語音分離

111、算法的實現(xiàn)</p><p>  4.1.1 實現(xiàn)平臺</p><p>  本實驗采用MATLAB7.0來實現(xiàn),MATLAB是矩陣實驗室(Matrix Laboratory)的簡稱,是美國Math Works公司出品的商業(yè)數(shù)學(xué)軟件,將數(shù)值分析、矩陣運算、編程技術(shù)、圖形處理結(jié)合在一起,是一個強有力的工程和科學(xué)問題的分析計算和程序設(shè)計的編程工具,它還具有專業(yè)水平的文字處理、符號計算、可視化建模仿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論