2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、自動(dòng)識(shí)別LRC歌詞,組員:蘇麗玲,肖斌,韋暢,許佳鈺,主要內(nèi)容,項(xiàng)目背景項(xiàng)目?jī)?nèi)容核心內(nèi)容項(xiàng)目意義,項(xiàng)目背景,每天幾乎都有成百上千的音樂發(fā)布于網(wǎng)上(包括新音樂,翻唱音樂,興趣愛好者的原創(chuàng)音樂,即興演唱等等),但相應(yīng)的LRC歌詞卻常常不能找到。自己制作一LRC歌詞有或多或少有些偏差。雖然目前市場(chǎng)上有不少語音識(shí)別軟件,但幾乎未出現(xiàn)與LRC歌詞軟件相似的產(chǎn)品隨著語音識(shí)別技術(shù)的發(fā)展,LRC歌詞軟件能相對(duì)準(zhǔn)確生成文字及根據(jù)算法可自動(dòng)生成時(shí)

2、間軸,生成LRC歌詞。這是語音識(shí)別技術(shù)的應(yīng)用發(fā)展。,項(xiàng)目?jī)?nèi)容,通過語音識(shí)別技術(shù)將播放出的音樂轉(zhuǎn)換成文字,通過算法自動(dòng)生成時(shí)間軸生成LRC歌詞并存儲(chǔ)。當(dāng)播放同一首音樂,能自動(dòng)匹配出相應(yīng)LRC歌詞。,核心內(nèi)容,判斷關(guān)聯(lián)歌詞文件生成語音識(shí)別歌詞文件校對(duì),判斷關(guān)聯(lián),關(guān)聯(lián)是指播放器等進(jìn)行音視頻播放的應(yīng)用程序可以根據(jù)音視頻文件的文件信息以某種特定的規(guī)則查找或優(yōu)選出唯一的歌詞文件。若當(dāng)前播放的音視頻文件關(guān)聯(lián)了歌詞文件,則載入其關(guān)聯(lián)的歌詞文件

3、若沒有關(guān)聯(lián)歌詞文件,則生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件。,歌詞文件生成方法及裝置,生成單元:用于在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件。文件信息包括但不限于:音視頻文件的文件名、音視頻文件的存儲(chǔ)位置、音樂家信息等,以生成與該音視頻文件的文件名命名的歌詞文件,從而通過相同的文件名建立起該音視頻文件與其歌詞文件的關(guān)聯(lián)關(guān)系??梢栽陬A(yù)設(shè)的存儲(chǔ)位置或者該音視頻文件的存儲(chǔ)位置生成該歌詞文件

4、,由此,可以使播放器在下一次播放此音視頻文件時(shí)能夠查找到此歌詞文件。,歌詞文件生成方法及裝置,第一記錄單元:用于記錄所述音視頻文件的每句歌詞的開始播放時(shí)間。第一語音識(shí)別單元:用于根據(jù)語音識(shí)別生成所述每句歌詞的文本。保存單元:用于將所述每句歌詞的所述開始播放的時(shí)間和所述文本關(guān)聯(lián)后保存進(jìn)所述歌詞空文件,直至所述音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件。,語音識(shí)別,監(jiān)聽音視頻文件的聲音波形。具體地,根據(jù)波形的振蕩圖形,可以辨識(shí)出

5、音視頻文件音頻分量中每一句歌詞的開始,將此時(shí)間點(diǎn)以預(yù)設(shè)格式記錄下來。辨識(shí)出每句歌詞的內(nèi)容對(duì)于寫入操作,每寫完一句歌詞會(huì)新起一行聲音信息轉(zhuǎn)化成語言文本。,語音識(shí)別優(yōu)化,通過對(duì)識(shí)別算法做相應(yīng)的微調(diào),語音識(shí)別技術(shù)可以用來辨識(shí)具有不同特點(diǎn)的聲音信息。以歌曲的旋律為參數(shù)對(duì)識(shí)別算法做相應(yīng)的微調(diào),即可準(zhǔn)確地辨識(shí)出歌詞信息。在對(duì)歌詞進(jìn)行語音識(shí)別時(shí),可以在數(shù)據(jù)庫(kù)中存儲(chǔ)常用的詞語或者成語的聲音波形,通過將音視頻文件的波形與存儲(chǔ)的波形進(jìn)行匹配,能夠更

6、加準(zhǔn)確地識(shí)別出歌詞的文本。,歌詞文件校對(duì)方法及裝置,載入單元:載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件。第二記錄單元:記錄所述音視頻文件每句歌詞的開始播放時(shí)間。第二語音識(shí)別單元:根據(jù)語音識(shí)別生成所述每句歌詞的文本。修改單元:對(duì)于所述每句歌詞,當(dāng)判斷出所述記錄的所述開始播放時(shí)間和所述歌詞文件中的開始播放時(shí)間不同,或者判斷出所述記錄的所述文本與所述歌詞文件中的文本不同,修改所述歌詞文件。,項(xiàng)目意義,LRC歌詞軟件對(duì)現(xiàn)在蓬勃的音樂發(fā)展具有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論