2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,第二章 數(shù)字聲音及MIDI簡(jiǎn)介,本章將介紹聲音的基礎(chǔ)知識(shí),重點(diǎn)掌握聲音數(shù)字化的兩個(gè)最基本的概念。此外,還介紹在上網(wǎng)瀏覽或者脫機(jī)工作時(shí)你會(huì)經(jīng)常遇到的聲音文件存儲(chǔ)格式和聲音工具。,2,2.1 聲音的重要性,聲音是攜帶信息的極其重要的媒體,是多媒體技術(shù)研究中的一個(gè)重要內(nèi)容。聲音的種類繁多,如人的話音、樂(lè)器聲、動(dòng)物發(fā)出的聲音、機(jī)器產(chǎn)生的聲音以及自然界的雷聲、風(fēng)聲、雨聲、閃電聲等。這些聲音有許多共同的特性,也有它們各自的特性。在用計(jì)算機(jī)

2、處理這些聲音時(shí),既要考慮它們的共性,又要利用它們各自的特性。,3,什么是聲音,聲音是通過(guò)一定介質(zhì)(如空氣、水等)傳播的連續(xù)的波,4,聲音的物理和心理特征,,5,音色,因?yàn)槁曇舻牟ㄐ谓^大多數(shù)都不是簡(jiǎn)單的正弦波,而是一種復(fù)雜的波。分析表明這 種復(fù)雜的波形,可以分解為一系列的正弦波,這些正弦波中有基頻f0,還有與f0成 整數(shù)倍關(guān)系的諧波:f1、f2、f3、f4,它們的振幅有特定的比例。這種比例,賦予 每種樂(lè)器以特

3、有的“色彩”—音色。如果沒有諧波成分,單純的基音正弦信號(hào)是 毫無(wú)音樂(lè)感的。 比如:大提琴音色、黑管音色不同雖然演奏同一音高(基頻)的音符,但人們能夠明確分辨出哪個(gè)是樂(lè)器,6,聲音特性,連續(xù)性時(shí)間和幅度上都是連續(xù)的。聲波具有普通波所具有的特性,例如反射 (reflection)、折射 (refraction)和衍射 (diffraction)等。,圖2-01 聲音是一種連續(xù)的波,7,第二章 數(shù)字聲音及MIDI簡(jiǎn)介,復(fù)合聲

4、音信號(hào):由許多頻率不同的信號(hào)組成的聲音信號(hào)。 分量聲音信號(hào):?jiǎn)我活l率的信號(hào)。 帶寬:用來(lái)描述復(fù)合聲音信號(hào)的頻率范圍。如高保真音信號(hào)(high-fidelity audio)的頻率范圍為10Hz~20,000Hz,帶寬約為20kHz,8,聲音的參數(shù),聲音信號(hào)的兩個(gè)基本參數(shù):頻率和幅度信號(hào)的頻率: 指信號(hào)每秒鐘變化的次數(shù),用Hz表示。例如,大氣壓的變化周期很長(zhǎng),以小時(shí)或天數(shù)計(jì)算,一般人不容易感到這種氣壓信號(hào)的變化,更聽不到這種

5、變化。對(duì)于頻率為幾Hz到20Hz的空氣壓力信號(hào),人們也聽不到,如果它的強(qiáng)度足夠大,也許可以感覺到。,9,按照頻率分類,次音信號(hào)(infrasonic):頻率小于20Hz的信號(hào)可聽音(Audio)信號(hào):頻率范圍為20Hz~20kHz的信號(hào)超聲波(ultrasonic)信號(hào):頻率高于20kHz的信號(hào)。具有很強(qiáng)的方向性,形成波束。在工業(yè)上得到廣泛的應(yīng)用,如超聲波探測(cè)儀,超聲波焊接設(shè)備等。,10,Audio,其中在Audio中話音(sp

6、eech)信號(hào):頻率范圍為300~3400Hz的信號(hào)全頻帶聲音 20-20kHzMusic /Noise.. 在多媒體技術(shù)中,處理的信號(hào)主要是Audio信號(hào),包括音樂(lè)、話音、風(fēng)聲、雨聲、鳥叫聲、機(jī)器聲等。,11,人的聽力,人耳對(duì)中頻段1~3千赫的聲音最為靈敏,對(duì)高、低頻段的聲音,特別是低頻段的聲音則比較遲鈍。利用這些特性可以在壓縮音頻數(shù)據(jù)時(shí)區(qū)分對(duì)待,12,按照存儲(chǔ)方式分

7、類,波形聲音(存儲(chǔ)的是波形)語(yǔ)音音樂(lè)效果聲合成聲音(存儲(chǔ)的是命令)MIDI,13,2.2 聲音信號(hào)數(shù)字化,2.2.1 從模擬過(guò)渡到數(shù)字 數(shù)字信號(hào)優(yōu)點(diǎn)精確、運(yùn)算容易、可編程,14,2.2.2 模擬信號(hào)與數(shù)字信號(hào),話音信號(hào)是典型的連續(xù)信號(hào),不僅在時(shí)間上是連續(xù)的,而且在幅度上也是連續(xù)的。 時(shí)間上“連續(xù)”:指在一個(gè)指定的時(shí)間范圍里聲音信號(hào)的幅值有無(wú)窮多個(gè)。 幅度上“連續(xù)”:指幅度的數(shù)值有無(wú)窮多個(gè)。模擬信號(hào):在時(shí)間

8、和幅度上都是連續(xù)的信號(hào)。,15,數(shù)字信號(hào),采樣(sampling):在某些特定時(shí)刻對(duì)模擬信號(hào)進(jìn)行測(cè)量。離散時(shí)間信號(hào):由這些特定時(shí)刻采樣得到的信號(hào)。 離散幅度信號(hào):采樣得到的幅值是無(wú)窮多個(gè)實(shí)數(shù)值中的一個(gè),因此幅度還是連續(xù)的。如果把信號(hào)幅度取值的數(shù)目加以限定,這種由有限個(gè)數(shù)值組成的信號(hào)就稱為離散幅度信號(hào)?!纠考僭O(shè)輸入電壓的范圍是0.0V~0.7V,并假設(shè)它的取值只限定在0、0.1、0.2,…,0.7共8個(gè)值。如果采樣得到的幅度值

9、是0.123V,它的取值就應(yīng)算作0.1V,如果采樣得到的幅度值是0.26V,它的取值就算作0.3,這種數(shù)值就稱為離散數(shù)值。數(shù)字信號(hào):時(shí)間和幅度都用離散數(shù)字表示的信號(hào)。,16,2.2.3 聲音信號(hào)數(shù)字化,數(shù)字化:采樣+量化,聲音進(jìn)入計(jì)算機(jī)的第一步處理。編碼?壓縮量化后的數(shù)據(jù)量,采 樣,17,采樣,采樣:連續(xù)時(shí)間的離散化。若每隔相等的一小段時(shí)間采樣一次,稱為均勻采樣(uniform sampling),采樣點(diǎn),,,,,18,采樣,采樣

10、頻率(fs):決定每秒鐘需要采集多少個(gè)聲音樣本。 奈奎斯特定理:采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍,這樣就能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音,這叫做無(wú)損數(shù)字化(lossless digitization)。 采樣定律 fs≥2f 或者 Ts≤T/2,其中f為被采樣信號(hào)的最高頻率。 理解奈奎斯特理論:聲音信號(hào)可以看成由許許多多正弦波組成的,一個(gè)振幅為A、頻率為f的正弦波至少需要兩個(gè)采樣樣本表示,因此,如果

11、一個(gè)信號(hào)中的最高頻率為fmax,采樣頻率最低要選擇2fmax。例如,電話話音的信號(hào)頻率約為3.4 kHz,采樣頻率就選為8 kHz。,19,量化,量化(quantization):連續(xù)幅度的離散化,就是把信號(hào)的強(qiáng)度劃分成一小段一小段。如果幅度的劃分是等間隔的,就稱為線性量化,否則就稱為非線性量化。,,,,,20,2.2.4 量化精度,每個(gè)采樣點(diǎn)樣本大小是用每個(gè)聲音樣本的位數(shù)bit表示的,它反映度量聲音波形幅度的精度。量化精度既決定了取

12、樣值的動(dòng)態(tài)范圍,也決定著所引入的噪聲大小。例如,每個(gè)聲音樣本用16位(2字節(jié))表示,測(cè)得的聲音樣本值是在0~65536的范圍里,它的精度就是輸入信號(hào)的1/65536。樣本位數(shù)的大小影響到聲音的質(zhì)量,位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲(chǔ)空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲(chǔ)空間越少。,21,信號(hào)噪聲比,采樣精度的另一種表示方法是信號(hào)噪聲比,簡(jiǎn)稱為信噪比(signal-to-noise ratio,SNR),并用下式計(jì)算:

13、 SNR=10log[(Vsignal)2/(Vnoise)2]=20log(Vsignal/Vnoise)其中,Vsignal表示信號(hào)電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(db)【例1】假設(shè)Vnoise=1,采樣精度為1位表示Vsignal=21,它的信噪比SNR=6分貝?!纠?】假設(shè)Vnoise=1,采樣精度為16位表示Vsignal=216,它的信噪比SNR=96分貝。,22,聲音的質(zhì)

14、量,根據(jù)聲音的頻帶,通常把聲音的質(zhì)量分成5個(gè)等級(jí),由低到高分別是:電話(telephone)、調(diào)幅(amplitude modulation,AM)廣播、調(diào)頻(frequency modulation,F(xiàn)M)廣播、激光唱盤(CD-Audio)和數(shù)字錄音帶(digital audio tape,DAT)的聲音。,23,聲音質(zhì)量和數(shù)據(jù)率,表2–01 聲音質(zhì)量和數(shù)據(jù)率,,24,2.2.5 聲音質(zhì)量與數(shù)據(jù)率,數(shù)據(jù)率 = 取樣頻率 x

15、量化位數(shù) x 通道數(shù)目例: 電話語(yǔ)音 =8k x 8b x 1 = 64kbps =8kB/s=28MB/h 例:CD的數(shù)據(jù)率44.1KHz, 16bits, 2,,25,2.3 聲音文件的存儲(chǔ)格式,在因特網(wǎng)上和各種機(jī)器上運(yùn)行的聲音文件格式很多,目前比較流行的有wav(waveform),au(audio),aiff(Audio

16、Interchangeable File Format)和snd(sound)文件格式。wav格式主要用在PC上,au主要用在Unix工作站上,aiff和snd主要用在蘋果機(jī)和美國(guó)視算科技有限公司(Silicon Graphics,Inc.,SGI)的工作站上。 wav文件稱為波形文件格式(WAVE File Format),它在多媒體編程接口和數(shù)據(jù)規(guī)范1.0(Multimedia Programming Interface an

17、d Data Specifications 1.0)文檔中有詳細(xì)的描述。該文檔是由IBM和微軟公司于1991年8月聯(lián)合開發(fā)的,它是一種為交換多媒體資源而開發(fā)的資源交換文件格式(Resource Interchange File Format,RIFF)。,26,波形文件格式,波形文件格式支持存儲(chǔ)各種采樣頻率和樣本精度的聲音數(shù)據(jù),并支持聲音數(shù)據(jù)的壓縮。 波形文件由許多不同類型的文件構(gòu)造塊組成,RIFF WAVE Chunk, Form

18、at Chunk, Fact Chunk(可選), Data Chunk。其中最主要的兩個(gè)文件構(gòu)造塊是Format Chunk(格式塊)和Sound Data Chunk(聲音數(shù)據(jù)塊)。格式塊包含有描述波形的重要參數(shù),例如采樣頻率和樣本精度等,聲音數(shù)據(jù)塊則包含有實(shí)際的波形聲音數(shù)據(jù)。,,,圖2–03 WAVE文件結(jié)構(gòu),http://www.moon-soft.com/program/FORMAT/sound/wave.htm,27,RIF

19、F wave chunk,struct RIFF_HEADER {  char szRiffID[4];  // 'R','I','F','F'  DWORD dwRiffSize;  char szRiffFormat[4]; // &

20、#39;W','A','V','E' }; Size為wav文件大小減去ID和Size所占用的字節(jié)數(shù),28,Format Chunk,====================================================================    |    

21、0;          |   字節(jié)數(shù)  |              具體內(nèi)容         &

22、#160;      |    ====================================================================    | ID            |

23、60; 4 Bytes  |   'fmt '                             |

24、60;   --------------------------------------------------------------------    | Size          |  4 Bytes  | 數(shù)值為16或18,18則最后又附加信息  

25、   |    --------------------------------------------------------------------  ----    | FormatTag     |  2 Bytes  | 編碼方式,一般為0x0001  &

26、#160;            |     |    --------------------------------------------------------------------     | 

27、   | Channels      |  2 Bytes  | 聲道數(shù)目,1--單聲道;2--雙聲道       |     |    ----------------------------------------

28、----------------------------     |    | SamplesPerSec |  4 Bytes  | 采樣頻率                 

29、            |     |    --------------------------------------------------------------------     |  

30、;  | AvgBytesPerSec|  4 Bytes  | 每秒所需字節(jié)數(shù)                       |     |===&g

31、t; WAVE_FORMAT    --------------------------------------------------------------------     |    | BlockAlign    |  2 Bytes  | 數(shù)據(jù)塊對(duì)齊單位(每個(gè)采樣需要的字節(jié)

32、數(shù)) |     |    --------------------------------------------------------------------     |    | BitsPerSample |  2 Bytes  | 每個(gè)采樣需要的bit數(shù) 

33、;                 |     |    -------------------------------------------------------------------- &

34、#160;   |    |               |  2 Bytes  | 附加信息(可選,通過(guò)Size來(lái)判斷有無(wú)) |     |    ---

35、-----------------------------------------------------------------  ----,29,Data Chunk,==================================    |       |所占字節(jié)數(shù)|  具體內(nèi)容   |

36、0;   ==================================    | ID    |  4 Bytes |   'data'    |    ---------------------------------- 

37、60;  | Size  |  4 Bytes |             |    ----------------------------------    | data  |   

38、       |             |    ----------------------------------,30,常見的聲音文件擴(kuò)展名,表2-02 常見的聲音文件擴(kuò)展名,31,常見的聲音文件擴(kuò)展名(2),*支持PC

39、M,ADPCM,m 率和A率波形(詳見第3章),32,2.4 聲音工具,聲音工具(audio tools)用來(lái)錄放、編輯和分析聲音文件,聲音工具使用相當(dāng)普遍,但功能相差很大。 Windows 本身帶的“Sound Recorder”在英文版Windows界面上單擊:Start→Programs→Accessories→Multimedia/Entertainment→Sound Recorder,可錄音,作簡(jiǎn)單的聲音編輯(如插入

40、、刪除等)。,圖2–04 Windows錄音機(jī),33,第二章 數(shù)字聲音及MIDI簡(jiǎn)介,2. 買聲音卡時(shí)帶的工具聲卡一般都附帶有聲音工具。例如,聲霸(Sound Blaster)卡帶有幾種聲音工具,通常要由用戶自己安裝。其中,功能比較強(qiáng)的是WaveStudio, 用戶界面如圖2–05所示。 圖2–05 Creative Wave Studio Version 4.00的用戶界面,34,第二章 數(shù)字聲音及MIDI簡(jiǎn)介,3. 網(wǎng)絡(luò)上下載的

41、工具因特網(wǎng)上有許多站點(diǎn)提供試用的或者是免費(fèi)的聲音工具。圖2–06所示的是Cool Edit工具,它很受聲音研究工作者的歡迎,還有g(shù)oldwave公司的聲音工具,Cakewalk,Cubase等。圖2–06 Cool Edit 的用戶界面,35,2.5 聲音質(zhì)量的度量,用聲音信號(hào)帶寬來(lái)衡量聲音的質(zhì)量:等級(jí)由高到低依次是DAT,CD,F(xiàn)M,AM和數(shù)字電話。 聲音客觀質(zhì)量度量:信噪比(signal to noise ratio,SNR)

42、,峰值信噪比PSNR。 主觀度量聲音質(zhì)量:召集若干實(shí)驗(yàn)者,由他們對(duì)聲音質(zhì)量的好壞進(jìn)行評(píng)分,求出平均值作為對(duì)聲音質(zhì)量的評(píng)價(jià)。這種方法稱為主觀平均判分法,所得的分?jǐn)?shù)稱為主觀平均(mean opinion score,MOS)分,比較通用的標(biāo)準(zhǔn)是5分制。(類似于評(píng)委打分),36,MOS,表2-03 聲音質(zhì)量評(píng)分標(biāo)準(zhǔn),,,37,2.6 電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng),2.6.1 MIDI簡(jiǎn)介 MIDI (Musical Instrum

43、ent Digital Interface)電子樂(lè)器數(shù)字接口,是在音樂(lè)合成器(music synthesizers)、樂(lè)器(musical instruments)和計(jì)算機(jī)之間交換音樂(lè)信息的一種標(biāo)準(zhǔn)協(xié)議。 MIDI是樂(lè)器和計(jì)算機(jī)使用的標(biāo)準(zhǔn)語(yǔ)言,是一套指令(即命令的約定),它指示樂(lè)器即MIDI設(shè)備要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號(hào),在MIDI電纜上傳送的不是聲音,而是發(fā)給MIDI設(shè)備或其它裝

44、置讓它產(chǎn)生聲音或執(zhí)行某個(gè)動(dòng)作的指令。,38,MIDI標(biāo)準(zhǔn)的優(yōu)點(diǎn),生成的文件比較小,因?yàn)镸IDI文件存儲(chǔ)的是命令,而不是聲音波形容易編輯,因?yàn)榫庉嬅畋染庉嬄曇舨ㄐ我菀椎枚嗫梢宰鞅尘耙魳?lè),因?yàn)镸IDI音樂(lè)可以和其它的媒體,如數(shù)字電視、圖形、動(dòng)畫、話音等一起播放,這樣可以加強(qiáng)演示效果。,39,2.6.2 產(chǎn)生MIDI樂(lè)音的方法,兩種方法1 FM(frequency modulation)合成法2 樂(lè)音樣本合成法,也稱為波形表(

45、Wavetable)合成法,40,FM合成聲音,早期,音樂(lè)合成器的先驅(qū)Robert Moog采用模擬電子器件生成復(fù)雜樂(lè)音。20世紀(jì)80年代初,美國(guó)斯坦福大學(xué)(Stanford University)一名叫John Chowning的研究生發(fā)明了一種產(chǎn)生樂(lè)音的新方法,稱為數(shù)字式頻率調(diào)制合成法(digital frequency modulation synthesis),簡(jiǎn)稱為FM合成器。他把幾種樂(lè)音的波形用數(shù)字來(lái)表達(dá),并且用數(shù)字計(jì)算

46、機(jī)而不是用模擬電子器件把它們組合起來(lái),通過(guò)數(shù)模轉(zhuǎn)換器(digital to analog convertor,DAC)來(lái)生成樂(lè)音。,41,工作原理,通過(guò)組合各種波形參數(shù)生成樂(lè)音斯坦福大學(xué)得到了發(fā)明專利,并且把專利權(quán)授給Yamaha公司,該公司把這種技術(shù)做在集成電路芯片里,成了世界市場(chǎng)上的熱門產(chǎn)品。FM合成法的發(fā)明使合成音樂(lè)工業(yè)發(fā)生了一次革命。,42,樂(lè)音樣本合成聲音,樂(lè)音樣本合成法:使用FM合成法來(lái)產(chǎn)生各種逼真的樂(lè)音是相當(dāng)困難的,有些

47、樂(lè)音幾乎不能產(chǎn)生。這種方法就是把真實(shí)樂(lè)器發(fā)出的聲音以數(shù)字的形式記錄下來(lái),播放時(shí)改變播放速度,從而改變音調(diào)周期,生成各種音階的音符。,43,樂(lè)音樣本的采集,樂(lè)音樣本的采集:音樂(lè)家在真實(shí)樂(lè)器上演奏不同的音符,選擇44.1 kHz的采樣頻率、16位的樂(lè)音樣本,這相當(dāng)于CD-DA的質(zhì)量,把不同音符的真實(shí)聲音記錄下來(lái)。樂(lè)音樣本通常放在ROM芯片上,ROM是超大規(guī)模集成電路(very large scale integrated,VLSI)芯片。

48、 樂(lè)音樣本合成器所需要的輸入控制參數(shù)比較少,可控的數(shù)字音效也不多,產(chǎn)生的聲音質(zhì)量比FM合成方法產(chǎn)生的聲音質(zhì)量要高。,44,MIDI系統(tǒng),PC機(jī)使用內(nèi)置的MIDI接口卡,用來(lái)把MIDI數(shù)據(jù)發(fā)送到外部的多音色MIDI合成器模塊。,45,語(yǔ)音合成(Speech synthesis),語(yǔ)音合成:利用適當(dāng)?shù)姆椒ê褪侄危瑥奈谋?、概念或意向通過(guò)合成產(chǎn)生語(yǔ)音的過(guò)程。語(yǔ)音合成的3個(gè)層次:從文本到語(yǔ)音的合成(Text-to-Speech,簡(jiǎn)稱TT

49、S);從概念到語(yǔ)音的合成(Concept-to-Speech);從意向到語(yǔ)音的合成(Intention-to-Speech)這三個(gè)層次反映了人類大腦中形成說(shuō)話內(nèi)容的不同過(guò)程,涉及人類大腦的高級(jí)神經(jīng)活動(dòng),46,文語(yǔ)轉(zhuǎn)換的要求,對(duì)合成語(yǔ)音的要求:可理解 自然低延遲 語(yǔ)速可變聲音可變語(yǔ)言可變應(yīng)用: 聲訊服務(wù),自動(dòng)應(yīng)答, 有聲電子郵件, 殘疾人服務(wù), 自動(dòng)配音等.,47,語(yǔ)音基礎(chǔ)知識(shí),音素(phoneme)是語(yǔ)音的最小

50、單位。音素分為:元音(vowel)(濁音),不受聲道阻礙的音。輔音(consonant)(濁音或清音), 受聲道阻礙的音。,48,英語(yǔ)語(yǔ)音,每字(詞)一個(gè)或幾個(gè)音節(jié)(syllable)(多音節(jié)字)音節(jié)由一個(gè)或幾個(gè)音素組成英語(yǔ)的音素: 元音20個(gè)輔音28個(gè),49,漢語(yǔ)語(yǔ)音,每字一個(gè)音節(jié)(syllable)(單音節(jié)字)音節(jié)由一個(gè)或幾個(gè)音素組成漢語(yǔ)的音素聲母(21個(gè),b,p,m,f,d,t,n,l,··&

51、#183;···)韻母(39個(gè),a, e,i, o, u,ao,ou,an,en,eng,ong,)音調(diào)(4個(gè): 陰平、陽(yáng)平、上聲、去聲)漢語(yǔ)語(yǔ)音的數(shù)目:無(wú)聲調(diào)的音節(jié)數(shù)目:412個(gè)帶聲調(diào)的音節(jié)數(shù)目:1282個(gè),50,漢語(yǔ)語(yǔ)音的特點(diǎn),(1)音系簡(jiǎn)單(音節(jié)少、音素少)(2)漢語(yǔ)沒有詞的自然界限——分詞問(wèn)題 咬死了獵人的狗 下雨天留客天留我不留

52、 今年真好晦氣全無(wú)財(cái)帛進(jìn)門 (3)一字多音: 我們都是同行,我們一路同行,去參加人參培植研討會(huì)。(4)數(shù)字的讀音: 復(fù)旦大學(xué)計(jì)算機(jī)系2002年招收了202名本科生,130多名碩士生,分成2個(gè)專業(yè)。,51,文語(yǔ)轉(zhuǎn)換過(guò)程,,查找拼寫錯(cuò)誤,對(duì)不規(guī)范或無(wú)法發(fā)音的字符進(jìn)行過(guò)濾。分析文本中詞或短語(yǔ)的邊界,分析文本中的數(shù)字、姓氏、特殊字符、專有詞語(yǔ)等有關(guān)詞語(yǔ)讀音的性質(zhì)

53、。,根據(jù)文本的結(jié)構(gòu)、組成和標(biāo)點(diǎn)符號(hào),確定發(fā)音時(shí)語(yǔ)氣的變換以及不同音的輕重方式。分析并決定各個(gè)音節(jié)的聲調(diào)、語(yǔ)氣和停頓方式,發(fā)音的輕重、長(zhǎng)短等,52,幾個(gè)TTS系統(tǒng),中國(guó)科大訊飛TTS系統(tǒng) http://www.iflytek.com/微軟亞洲研究院的木蘭系統(tǒng) https://research.microsoft.com/speech/tts/TTS.asp貝爾實(shí)驗(yàn)室 http://www.bell-labs

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論