版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、自然語(yǔ)言處理的新需求、新資源、新技術(shù),董振東 董強(qiáng)e-mail: dzddong@public.bta.net.cnhttp://www.keenage.comTel: (8610) 6287-5641 Tel: (8610) 6676-8816 Intel China Research Forum北京 2000/10/11,提綱差距與反思 -- 成就是過(guò)去時(shí),不足是將來(lái)時(shí)《知網(wǎng)》-- 一種
2、新的資源 -- 新資源促進(jìn)新技術(shù),差距與反思,層次淺語(yǔ)境窄知識(shí)顆粒度小流行技術(shù)的極限,音字轉(zhuǎn)換信息過(guò)濾文本分析語(yǔ)音識(shí)別文本分類歧義排除OCR信息檢索文本理解語(yǔ)法檢查自動(dòng)文摘機(jī)器翻譯,音字轉(zhuǎn)換系統(tǒng)(輸入法)上這攤某被立即送往醫(yī)院,但終因史學(xué)過(guò)多,不止身亡。傷者譚某被立即送往醫(yī)院,但終因失血過(guò)多,不治身亡。上這里某被立即送往醫(yī)院,但終因留學(xué)過(guò)多,不止身亡。傷者李某被立即送往醫(yī)院,但
3、終因流血過(guò)多,不治身亡。唐非情此獲準(zhǔn)。唐飛請(qǐng)辭獲準(zhǔn)。,語(yǔ)法檢查In a few years' time, there will be no Internet companies -- there will just be companies -- and all companies that are going to operate in the economics of a few years, in the fut
4、ure, are going to be Internet companies. -- Andrew S. Grove(1) areThe world will little note, nor long remember what we say here, but it can never forget what they did here.-- Abraham Lincon(1)world
5、wills / worlds will(2)will little neither note, nor / will no little note, orIt would be something that we actually will almost take for granted and wonder how business was done before we incorporated this in a very d
6、eep way-- Bill Gates (1) wonders,信息檢索華人 ? 中華人民共和國(guó),新華人壽保險(xiǎn)北大 ? 北大西洋,北大荒,臺(tái)北大學(xué)葡萄 ? 葡萄牙,葡萄糖,自動(dòng)文摘Advances in Automatic Text SummarizationWith the rapid growth of the World Wide Web and electronic information
7、 services, information is becoming available on-line at an incredible rate. One result is the oft-decried information overload. No one has time to read everything, yet we often have to make critical decisions based on wh
8、at we are able to assimilate. The technology of automatic text summarization is becoming indispensable for dealing with this problem. Text summarization is the process of distilling the most important information from a
9、source to produce an abridged version for a particular user or task. Until now there has been no state-of-the-art collection of the most important writings in automatic text summarization. This book presents the key de
10、velopments in the field in an integrated framework and suggests future research areas. The book is organized into six sections: Classical Approaches, Corpus-Based Approaches, Exploiting Discourse Structure, Knowledge-Ric
11、h Approaches, Evaluation Methods, and New Summarization Problem Areas. (55%),自動(dòng)翻譯Do you think I could stay here and become nothing to you? Do you think, because I am poor, and obscure and plain, th
12、at I am soulless and heartless? I have as much soul as you and fully as much heart. And if God had gifted me with wealth and beauty I should have made it as hard for you to leave me as it is now for me to leave you. Ther
13、e I have spoken my heart and let me go.你想我可以在這里停留并且適合沒有任何東西成為你嗎?你想,因?yàn)槲邑毟F,并且昏暗和簡(jiǎn)明,我是卑鄙和無(wú)情的嗎?我有和靈魂AS多你和充分作為許多心臟。同時(shí)如果上帝有我天才財(cái)富以及美麗我作為應(yīng)該使它努力為你因?yàn)樗F(xiàn)在為我。我已在那里說(shuō)我的心臟并且讓我去。(1988年推出的系統(tǒng))你認(rèn)為我能這里留下和變成對(duì)你沒有什么嗎?你因?yàn)槲沂强蓱z和不引人注目和清楚
14、,認(rèn)為我是沒有靈魂的和無(wú)情嗎?我有同樣多作為你精神和完全同樣多心臟.和如果上帝有有天賦有財(cái)富的我和美,我應(yīng)該已使它變得你同樣地難以現(xiàn)在我留下你讓我保持現(xiàn)在的樣子.那里我說(shuō)我的心臟已和讓我去。(1999年推出的系統(tǒng)),《知網(wǎng)》-- 一種新的資源,《知網(wǎng)》的近期發(fā)展與應(yīng)用《知網(wǎng)》的關(guān)鍵,HowNet 意味著什么?How knowledge is represented and acquired?How meanin
15、g can be formalized and calculated?How meaning is expressed and conveyed?,《知網(wǎng)》近期的發(fā)展,《知網(wǎng)》2000版與1999版的不同2000版1999版語(yǔ)種中(GB)-英雙語(yǔ) GB + Big5功能瀏覽器 + 數(shù)據(jù)維護(hù)基本數(shù)據(jù)知識(shí)詞典11萬(wàn)記錄6萬(wàn)記錄新增修訂10,000余增加中文多義義項(xiàng)
16、例子內(nèi)容擴(kuò)展事件關(guān)系與角色轉(zhuǎn)換庫(kù)知網(wǎng)-中文信息結(jié)構(gòu)庫(kù),《知網(wǎng)》近期的應(yīng)用,資源擴(kuò)展語(yǔ)義標(biāo)注建立關(guān)系網(wǎng)絡(luò)信息處理應(yīng)用語(yǔ)義分析排除歧義英中-中英雙向機(jī)器翻譯信息過(guò)濾,《知網(wǎng)》的關(guān)鍵,《知網(wǎng)》的靈魂關(guān)系 -- 關(guān)系的動(dòng)態(tài)的、多層次的體現(xiàn)寓于靜態(tài)的、孤立的描述之中意義的形式化、可計(jì)算《知網(wǎng)》應(yīng)用的關(guān)鍵 -- 新技術(shù)的引入大語(yǔ)境 – 可能且受鼓勵(lì)元規(guī)則的機(jī)制,舉例:,我上星期把自行車賣了。今天一大
17、早買主來(lái)找我,他說(shuō)那車的車身有過(guò)硬傷,他要退貨。買主 -- the buyer車 – bycicle (bike)? or car?車身 -- the body of,sell|賣[agent,possession,target,cost]buy|買(X)??sell|賣(Y) [mutual implication]; agent OF buy|買=target OF sell|賣; source OF buy|
18、買=agent OF sell|賣; possession OF buy|買=possession OF sell|賣; cost OF buy|買=cost OF sell|賣.W_C=買主G_C=NE_C=W_E=buyerG_E=NE_E=DEF=human|人,#commercial|商,*buy|買,W_C=自行車G_C=NE_C=W_E=bicycleG_E=NE_E=DEF=LandVe
19、hicle|車車 – [last]查詢,W_C=車身G_C=NE_C=W_E=body of a vehicleG_E=NE_E=DEF=part|部件,%LandVehicle|車,body|身,唐飛請(qǐng)辭獲準(zhǔn)。SYN_S=V --> VSEM_S=(事件,行動(dòng),使動(dòng)/阻動(dòng)) --> [結(jié)果事件] (事件) 請(qǐng)-示,請(qǐng)-轉(zhuǎn),請(qǐng)-來(lái),請(qǐng)-教,請(qǐng)-吃,請(qǐng)-喝,請(qǐng)-提意見,SYN_S=V <-
20、- VSEM_S=(事件) [遞續(xù)] <-- (事件) 舉槍-射擊,拔槍-射擊,拔刀-相助,拜師-學(xué)藝,打擊-報(bào)復(fù), 討論-決定,討論-通過(guò),立案-偵查,報(bào)到-上班,掛號(hào)-交費(fèi), 細(xì)嚼-慢咽,登臺(tái)-獻(xiàn)藝,握手-告別,前來(lái)-報(bào)到,列隊(duì)-歡迎, 泛濫-成災(zāi),撥號(hào)-接通,離家-出走,縱火-焚燒,改惡-從善, 走私-販私,出席-作陪,防火-護(hù)林,封山-育林,退耕-還林, 抗洪-救災(zāi),團(tuán)結(jié)-互助,團(tuán)結(jié)-
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 自然語(yǔ)言處理中的資源共享
- 自然語(yǔ)言處理商用資源授權(quán)協(xié)議
- 自然語(yǔ)言處理分詞文檔
- 自然語(yǔ)言處理分詞文檔
- 最新自然語(yǔ)言處理naturallanguageprocessingnlp
- 基于統(tǒng)計(jì)的自然語(yǔ)言處理.pdf
- 自然語(yǔ)言處理中相關(guān)語(yǔ)義技術(shù)的研究.pdf
- 統(tǒng)計(jì)自然語(yǔ)言處理基本概念
- 自然語(yǔ)言處理課程教學(xué)大綱
- 幾何自然語(yǔ)言理解技術(shù).pdf
- 科研文獻(xiàn)核心文本的自然語(yǔ)言處理.pdf
- 面向領(lǐng)域自然語(yǔ)言處理方法的研究.pdf
- 自然語(yǔ)言處理導(dǎo)論課復(fù)習(xí)提綱
- 自然語(yǔ)言時(shí)間語(yǔ)義信息處理.pdf
- 基于自然語(yǔ)言處理的自動(dòng)文摘系統(tǒng).pdf
- 基于自然語(yǔ)言處理的程序設(shè)計(jì)資源解題知識(shí)發(fā)現(xiàn)研究.pdf
- 神經(jīng)語(yǔ)言模型在自然語(yǔ)言處理中的應(yīng)用.pdf
- 基于自然語(yǔ)言處理技術(shù)的英漢雙語(yǔ)檢索系統(tǒng).pdf
- 基于深度學(xué)習(xí)的中文自然語(yǔ)言處理.pdf
- 自然語(yǔ)言的計(jì)算機(jī)處理模型.pdf
評(píng)論
0/150
提交評(píng)論