基于語音識別的智能HCI技術的研究.pdf_第1頁
已閱讀1頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著語音識別理論的成熟和一些相關算法在語音識別技術實用化進程中被采用,語音識別技術朝著實用化方向深入發(fā)展。人機交互(HCI)技術是研究人與計算機之間相互理解交流與通信(包括輸入和輸出),從而幫助人們完成信息管理服務與處理功能的一項技術。新一代人機交互技術的提出是最近20年計算機科學領域的熱門課題,獲得國內外極大關注,相關科研機構和公司投入大量的人力和財力進行創(chuàng)新型和實用型研究,其中智能人機交互技術作為一項研究的關鍵技術。在實際中表現(xiàn)在:

2、目前智能電子產品如智能手機及平板電腦的競爭已經演變成為操作體驗的競爭。新一代人機交互強調如下幾個特點:“以人為中心”、多模式交互、智能感知、多維度環(huán)境中的交互等。來自2011年下半年的數(shù)據顯示智能手機和平板電腦的出貨量首次超過PC,宣告地球已經進入移動互聯(lián)網時代,同時宣告手持計算成為當今的最重要的計算模式之一,但是手持計算中HCI的自然性不高和交互效率問題暴露得很明顯,多通道交互方式和多通道用戶界面能夠有效地提高它的人機交互的效率。將基

3、于語音識別的輸入方法和語音合成的輸出方法的交互方式融入到新一代人機交互模式中去,成為了完善人機交互手段的一種新思路,具有探討的必要性和較高的實際應用價值。
   對語音智能HCI技術實現(xiàn)的關鍵環(huán)節(jié)即輸入通道的語音模型的建立進行了分析,包含語音通道的優(yōu)勢以及缺陷,提出了相應的解決方法,這里介紹了引入其它輔助交互輸入方式。重點分析了語音信號的識別方法,包含語音信號的產生模型、預處理、參數(shù)提取和處理、識別算法。然后分析了數(shù)字音樂播放器

4、命令的語音庫到控制命令的映射。最后分析了手持移動平臺智能HCI語音輸入通道模型的建立,并在流行的移動智能操作系統(tǒng)Android上予以實現(xiàn),移動終端無時無刻都具有聯(lián)網優(yōu)勢,這里探討了利用服務器完成識別,從而減輕移動終端的計算負擔的技術,給出了具體軟件開發(fā)內容。整篇文章內容上涵蓋了語音識別智能HCI輸入通道的建立過程。
   在語音前端處理中對預加重和端點檢測給出了分析,在語音參數(shù)選擇上,分析了LPC、LPCC和MFCC參數(shù),以及在

5、語音識別的模型分析中,結合目前移動終端的處理能力和實際應用需求,對基于DTW的模板匹配算法做出了詳細分析,以及對MKM聚類算法做了分析。通過一些仿真實驗的分析,取得了一些有意義的結果。算法能夠保證較好的實時性要求,取得了較高的識別率,從而為實際應用提供了保證。本課題面向人機交互在數(shù)字音樂播放器平臺的應用,針對該平臺移動環(huán)境下的實際需要,對其進行了交互需求分析及評價,并分析了語音交互模型,針對手持計算平臺Android給出的具體軟件設計分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論