發(fā)音的3D可視化研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：121 大?。?.16MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩120頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、人際語言交流是一個多模態(tài)信息處理過程。除了承載語義信息的語音以外，人的面部表情和肢體動作也對語言的理解和交流起到一定的作用。認知心理學的實驗結(jié)果表明，相比于單一的聽覺輸入，來自聽覺、視覺的多模態(tài)信息對于語音的理解具有很大的作用。特別值得一提的是，對于有聽力障礙的人而言，有效的唇讀和對說話者面部表情和肢體語言的把握可以幫助他們準確地推斷、理解說話者的意圖。此外，對于語言學習者而言，了解發(fā)音時唇部、上下顎以及舌頭等發(fā)音器官的運動狀況等信息，

2、對于提高語言的學習效果具有指導意義。
　　本研究以發(fā)音的3D可視化為研究主線，以人機語音交互為研究背景，從理論、方法和系統(tǒng)三個層面探討發(fā)音器官的3D可視化問題，重點研究相關(guān)的發(fā)音器官建模、運動模擬和發(fā)音的準確性評估等問題。希望通過研究，構(gòu)建一個可以產(chǎn)生同步語音動畫的可視化三維虛擬人頭及其口腔系統(tǒng)。選題對于發(fā)音的3D可視化、語言教學乃至人機交互都將起到積極的推進作用，具有重要的理論意義和潛在的應用前景。
　　論文的主要研究內(nèi)容

3、和創(chuàng)新點如下:
　　1.針對口腔內(nèi)發(fā)音器官非完全可見或完全非可見的情況，從發(fā)音器官可視化的角度出發(fā)，研究了口腔內(nèi)發(fā)音器官的建模和運動模擬問題。首先采用醫(yī)學影像技術(shù)獲取這些發(fā)音器官的形狀數(shù)據(jù)，然后通過對矢狀位與橫斷位多層切面的核磁共振圖像（MRI）進行預處理和形狀網(wǎng)格化操作獲得其三維靜態(tài)表觀模型，并根據(jù)發(fā)音器官是否可形變的特點，給出相應的運動模擬方法。具體言之，對于牙齒、硬腭以及下顎這些在發(fā)音過程中僅產(chǎn)生微小形變，甚至不產(chǎn)生形變的發(fā)

4、音器官，將其看作剛體并進行運動模擬;而對于舌頭、軟腭這些在發(fā)音過程中產(chǎn)生大量形變的發(fā)音器官，則引入彈簧網(wǎng)模型來模擬其形變效果，并利用采集的Electromagnetic Articulography(EMA)數(shù)據(jù)來驅(qū)動和控制其運動。最終，通過實驗實現(xiàn)了漢語發(fā)音的發(fā)音器官運動模擬。
　　2.針對發(fā)音器官在運動模擬過程中可能出現(xiàn)的相互穿越問題，提出了一種可有效應用于口腔內(nèi)可形變發(fā)音器官的碰撞檢測和處理的方法。根據(jù)需要將可形變發(fā)音器官產(chǎn)

5、生的碰撞細分為可形變發(fā)音器官與非可形變發(fā)音器官之間產(chǎn)生的碰撞以及可形變發(fā)音器官與可形變發(fā)音器官之間產(chǎn)生的碰撞。碰撞檢測和響應過程如下所示。首先通過計算當前發(fā)音器官表面網(wǎng)格上的點與其余發(fā)音器官表面網(wǎng)格上的點的交點來判斷碰撞是否發(fā)生，并在碰撞發(fā)生時計算碰撞發(fā)生的位置。然后，對碰撞進行處理。為了避免由于運動模擬而導致的發(fā)音器官之間可能出現(xiàn)的相互穿越現(xiàn)象，給出了一種快速的碰撞響應方法，有效解決了發(fā)音器官之間可能出現(xiàn)的相互穿越問題。所進行的舌頭和

6、嘴唇的碰撞實驗驗證了上述方法的有效性。
　　3.發(fā)音器官運動準確性評估是3D發(fā)音可視化研究的難點。本文從主、客觀兩個方面對運動模擬結(jié)果進行了全面而細致的評估，提出了一種基于輪廓比較的發(fā)音器官運動準確性客觀評估方法。該方法通過對醫(yī)學影像中發(fā)音器官進行自動標定和手工修正來獲得其輪廓信息，并將該輪廓信息與合成得到的發(fā)音器官每一時刻下的輪廓信息進行比較，克服了傳統(tǒng)的基于EMA數(shù)據(jù)的方法無法給出每一時刻下可形變發(fā)音器官輪廓信息的缺陷。實驗結(jié)

7、果表明，本方法可以實現(xiàn)更加全面而有效的評估效果，較好解決了發(fā)音器官運動準確性評估問題。
　　4.設(shè)計并實現(xiàn)了一個可以產(chǎn)生同步語音動畫的3D可視化虛擬發(fā)音人系統(tǒng)。該系統(tǒng)基于C++與OpenGL而開發(fā)，并利用NDI Wave設(shè)備采集的EMA數(shù)據(jù)來驅(qū)動發(fā)音器官，不僅可以產(chǎn)生語音同步的人臉動畫，而且可以展示與所發(fā)語音對應的口腔內(nèi)發(fā)音器官的運動過程。同時，系統(tǒng)還將虛擬人頭部的表觀模型和嘴唇的運動模型集成在內(nèi)，實現(xiàn)了更友好的人機交互界面。對系

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

發(fā)音的3D可視化研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

發(fā)音的3D可視化研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載