版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、語(yǔ)音識(shí)別在計(jì)算機(jī)技術(shù)中,語(yǔ)音識(shí)別是指為了達(dá)到說(shuō)話者發(fā)音而由計(jì)算機(jī)生成的功能,利用計(jì)算機(jī)識(shí)別人類(lèi)語(yǔ)音的技術(shù)。(例如,抄錄講話的文本,數(shù)據(jù)項(xiàng)經(jīng)營(yíng)電子和機(jī)械設(shè)備電話的自動(dòng)化處理),是通過(guò)所謂的自然語(yǔ)言處理的計(jì)算機(jī)語(yǔ)音技術(shù)的一個(gè)重要元素。通過(guò)計(jì)算機(jī)語(yǔ)音處理技術(shù),來(lái)自語(yǔ)音發(fā)音系統(tǒng)的由人類(lèi)創(chuàng)造的聲音,包括肺,聲帶和舌頭,通過(guò)接觸,語(yǔ)音模式的變化在嬰兒期、兒童學(xué)習(xí)認(rèn)識(shí)有不同的模式,盡管由不同人的發(fā)音,例如,在音調(diào),語(yǔ)氣,強(qiáng)調(diào),語(yǔ)調(diào)模式不同的發(fā)音相同的
2、詞或短語(yǔ),大腦的認(rèn)知能力,可以使人類(lèi)實(shí)現(xiàn)這一非凡的能力。在撰寫(xiě)本文時(shí)(2008年),我們可以重現(xiàn),語(yǔ)音識(shí)別技術(shù)不只表現(xiàn)在有限程度的電腦能力上,在其他許多方面也是有用的。語(yǔ)音識(shí)別技術(shù)的挑戰(zhàn)語(yǔ)音識(shí)別技術(shù)的挑戰(zhàn)古老的書(shū)寫(xiě)系統(tǒng)要回溯到蘇美爾人的六千年前。他們可以將模擬錄音通過(guò)留聲機(jī)進(jìn)行語(yǔ)音播放,直到1877年。然而,由于與語(yǔ)音識(shí)別各種各樣的問(wèn)題,語(yǔ)音識(shí)別不得不等待著計(jì)算機(jī)的發(fā)展。首先演講不是簡(jiǎn)單的口語(yǔ)文本——同樣的道理戴維斯很難捕捉到一個(gè)not
3、efnote曲作為樂(lè)譜。人類(lèi)所理解的詞、短語(yǔ)或句子離散與清晰的邊界實(shí)際上是將信號(hào)連續(xù)的流而不是聽(tīng)起來(lái):Iwenttothesteyesterday昨天我去商店。單詞也可以混合用Whaddayawa嗎這代表著你想要做什么。第二沒(méi)有一對(duì)一的聲音和字母之間的相關(guān)性。在英語(yǔ)有略多于5個(gè)元音字母——aeiou有時(shí)y和w。有超過(guò)二十多個(gè)不同的元音雖然精確統(tǒng)計(jì)可以取決于演講者的口音而定。但相反的問(wèn)題也會(huì)發(fā)生在那里一個(gè)以上的信號(hào)能再現(xiàn)某一特定的聲音。字
4、母C可以有相同的字母K的聲音,如蛋糕,或作為字母S,如柑橘。此外說(shuō)同一語(yǔ)言的人使用不相同的聲音即語(yǔ)言不同他們的聲音語(yǔ)音或模式的組織,有不同的口音。例如“水”這個(gè)詞wadder可以顯著watter,woaderwattah等等。每個(gè)人如果你認(rèn)為一個(gè)人之所以從事語(yǔ)音識(shí)別方面的研究是因?yàn)樗艿玫浇疱X(qián),那就太草率了。這種吸引力也許類(lèi)似于把水變成汽油、從海水中提取黃金、治愈癌癥或者登月的誘惑。一個(gè)人不可能用削減肥皂成本10℅的方法簡(jiǎn)單地得到錢(qián)。如
5、果想騙到人,他要用欺詐和誘惑。皮爾斯1969年的信標(biāo)志著在貝爾實(shí)驗(yàn)室持續(xù)了十年的研究結(jié)束了。然而,國(guó)防研究機(jī)構(gòu)ARPA選擇了堅(jiān)持下去。1971年他們資助了一項(xiàng)開(kāi)發(fā)一種語(yǔ)音識(shí)別器的研究計(jì)劃,這種語(yǔ)音識(shí)別器要能夠處理至少1000個(gè)詞并且能夠理解相互連接的語(yǔ)音,即在語(yǔ)音中沒(méi)有詞語(yǔ)之間的明顯停頓。這種語(yǔ)音識(shí)別器能夠假設(shè)一種存在輕微噪音背景的環(huán)境,并且它不需要在真正的時(shí)間中工作。到1976年,三個(gè)承包公司已經(jīng)開(kāi)發(fā)出六種系統(tǒng)。最成功的是由卡耐基麥隆
6、大學(xué)開(kāi)發(fā)的叫做“Harpy”的系統(tǒng)?!癏arpy”比較慢,四秒鐘的句子要花費(fèi)五分多鐘的時(shí)間來(lái)處理。并且它還要求發(fā)音者通過(guò)說(shuō)句子來(lái)建立一種參考模型。然而,它確實(shí)識(shí)別出了1000個(gè)詞匯,并且支持連音的識(shí)別。研究通過(guò)各種途徑繼續(xù)著,但是“Harpy”已經(jīng)成為未來(lái)成功的模型。它應(yīng)用隱馬爾科夫模型和統(tǒng)計(jì)模型來(lái)提取語(yǔ)音的意義。本質(zhì)上,語(yǔ)音被分解成了相互重疊的聲音片段和被認(rèn)為最可能的詞或詞的部分所組成的幾率模型。整個(gè)程序計(jì)算復(fù)雜,但它是最成功的。在1
7、970s到1980s之間,關(guān)于語(yǔ)音識(shí)別的研究繼續(xù)進(jìn)行著。到1980s,大部分研究者都在使用隱馬爾科夫模型,這種模型支持著現(xiàn)代所有的語(yǔ)音識(shí)別器。在1980s后期和1990s,DARPA資助了一些研究。第一項(xiàng)研究類(lèi)似于以前遇到的挑戰(zhàn),即1000個(gè)詞匯量,但是這次要求更加精確。這個(gè)項(xiàng)目使系統(tǒng)詞匯出錯(cuò)率從10℅下降了一些。其余的研究項(xiàng)目都把精力集中在改進(jìn)算法和提高計(jì)算效率上。2001年微軟發(fā)布了一個(gè)能夠與0fficeXP同時(shí)工作的語(yǔ)音識(shí)別系統(tǒng)。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 文獻(xiàn)翻譯(1)
- 文獻(xiàn)翻譯1.doc
- 文獻(xiàn)翻譯1.docx
- 文獻(xiàn)翻譯1.docx
- 科技文獻(xiàn)翻譯1.doc
- 地質(zhì)文獻(xiàn)翻譯1.pdf
- 科技文獻(xiàn)翻譯1.doc
- 地質(zhì)文獻(xiàn)翻譯1.doc
- 地質(zhì)文獻(xiàn)翻譯1.doc
- 地質(zhì)文獻(xiàn)翻譯1.pdf
- 外文文獻(xiàn)翻譯 (1).doc
- 文獻(xiàn)翻譯封面1.doc
- 參考文獻(xiàn)1翻譯.doc
- 翻譯文獻(xiàn)1.doc
- 科技文獻(xiàn)翻譯1.doc
- 外文文獻(xiàn)翻譯 (1).doc
- 參考文獻(xiàn)1翻譯.doc
- 地質(zhì)文獻(xiàn)翻譯原文1.pdf
- 文獻(xiàn)翻譯myy4-1.docx
- 地質(zhì)文獻(xiàn)翻譯原文1.pdf
評(píng)論
0/150
提交評(píng)論