可區(qū)分性原則在語(yǔ)音分離中的應(yīng)用.pdf_第1頁(yè)
已閱讀1頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音技術(shù)是現(xiàn)代計(jì)算機(jī)技術(shù)中非常重要的技術(shù)。人與人之間進(jìn)行交流的最自然方式是語(yǔ)言。而現(xiàn)代計(jì)算機(jī)的使用是通過(guò)鼠標(biāo)和鍵盤輸入,通過(guò)顯示器、打印機(jī)等設(shè)備來(lái)得到計(jì)算機(jī)輸出的結(jié)果。這對(duì)人來(lái)說(shuō)當(dāng)然不是最自然的交流方式。從這個(gè)意義上來(lái)說(shuō),現(xiàn)代計(jì)算機(jī)并不是最終的和最好的產(chǎn)品;而只是人類以自己對(duì)環(huán)境的適應(yīng)能力來(lái)屈就的產(chǎn)物。因此,一直以來(lái),計(jì)算機(jī)科學(xué)家們都在尋找能夠使計(jì)算機(jī)能夠與人通過(guò)自然語(yǔ)言交流的技術(shù)?! 〉侵钡浆F(xiàn)在,語(yǔ)音技術(shù)還沒(méi)有全面進(jìn)入實(shí)用化、商用

2、化。主要是因?yàn)楝F(xiàn)代語(yǔ)音技術(shù)還有兩個(gè)關(guān)鍵的問(wèn)題沒(méi)有完全解決。其一是噪聲環(huán)境下的語(yǔ)音增強(qiáng)和分離技術(shù);其二是完善的自然語(yǔ)言理解?! 〔荒芙鉀Q語(yǔ)音技術(shù)的這兩個(gè)非常關(guān)鍵的前、后端技術(shù),語(yǔ)音技術(shù)就不可能進(jìn)入大規(guī)模應(yīng)用,只能是研究人員手中的玩具?! ≡肼暛h(huán)境下的語(yǔ)音識(shí)別技術(shù)一直都是語(yǔ)音識(shí)別系統(tǒng)的重點(diǎn)和難點(diǎn)。但是在很長(zhǎng)的時(shí)間中,由于相應(yīng)的數(shù)學(xué)方法和技術(shù)手段一直沒(méi)有得到發(fā)展,所以進(jìn)步很慢?! ‰S著上世紀(jì)九十年代中期,高階統(tǒng)計(jì)學(xué)和分?jǐn)?shù)低階統(tǒng)計(jì)學(xué)應(yīng)用的

3、逐漸推廣,出現(xiàn)了從PCA(主成分分析)技術(shù)中發(fā)展出來(lái)的ICA技術(shù),從FA(因子分析)技術(shù)中發(fā)展出來(lái)的IFA技術(shù)。這兩種技術(shù)不需要知道信號(hào)的先驗(yàn)知識(shí),就可以幾乎很完美地分離出每一個(gè)信號(hào)。雖然這兩種技術(shù)都存在一定缺陷,由于技術(shù)本身顯示出來(lái)的能力,導(dǎo)致現(xiàn)代信號(hào)分離技術(shù)(特別是盲信號(hào)分離技術(shù)的)的迅速發(fā)展?,F(xiàn)在,盲信號(hào)分離技術(shù)在其他方向也取得了一定進(jìn)步,并因此帶動(dòng)了語(yǔ)音分離技術(shù)的進(jìn)步?! ⊥ㄟ^(guò)對(duì)大量文獻(xiàn)的閱讀、研究、抽象和總結(jié),本文提出以下的

4、可區(qū)分性原則:  原始混合信號(hào)可投影于這樣的投影空間,在該投影空間中同一信號(hào)由于某些特征而在投影空間中密集分布,而信號(hào)之間由于這些特征的區(qū)別在投影空間中完全分離或者稀疏過(guò)渡;或者不同信號(hào)雖然聚集在一起,但是投影空間足夠稀疏而可以相互區(qū)分?! 〔⒃谠撛瓌t指導(dǎo)下,提出了以下信號(hào)分離的廣義框架:  1將信號(hào)投影到某一特征投影空間;  2在該投影空間中對(duì)信號(hào)的參數(shù)按照一定規(guī)則聚類;  3從投影空間將聚類后的信號(hào)向信號(hào)空間進(jìn)行逆映射,重

5、構(gòu)信號(hào)?! ∫陨系膹V義框架就是信號(hào)分解技術(shù)的關(guān)鍵步驟。對(duì)于不同的算法,雖然進(jìn)行分離的途徑之間極其不同,但是都要經(jīng)過(guò)以上的“投影—聚類—重構(gòu)”過(guò)程?! 』谝陨系目蓞^(qū)分原則和由此推出的信號(hào)分離的廣義框架,本文分析了各種可能的可以進(jìn)行信號(hào)分離的投影空間,并對(duì)在這些空間進(jìn)行聚類的技術(shù)進(jìn)行了分析?! ≡诖嘶A(chǔ)上,本文將兩種相應(yīng)信號(hào)分離技術(shù)用到雙聲道語(yǔ)音分離技術(shù)。因?yàn)殡p聲道語(yǔ)音分離往往需要分離出遠(yuǎn)多于聲道數(shù)的源信號(hào)。這時(shí)問(wèn)題是超定的,需要用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論