招生問(wèn)答系統(tǒng)的設(shè)計(jì)[文獻(xiàn)綜述]_第1頁(yè)
已閱讀1頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  (2011屆)</b></p><p><b>  畢業(yè)論文(設(shè)計(jì))</b></p><p><b>  文獻(xiàn)綜述</b></p><p>  題  目: 招生問(wèn)答系統(tǒng)的設(shè)計(jì)   </p><p>  學(xué)  院:  

2、 商學(xué)院    </p><p>  專(zhuān)  業(yè):   信息管理與信息系統(tǒng)   </p><p>  班  級(jí):       </p><p>  學(xué)  號(hào):         </p><p>

3、;  姓  名:      </p><p>  指導(dǎo)教師:       </p><p><b>  教 務(wù) 處 制</b></p><p><b>  一、前言部分</b></p><p>

4、  2010年6月,參加2010年高考的人數(shù)為976萬(wàn),雖然人數(shù)比去年下降,但是由于從2005年以來(lái)各個(gè)高校的擴(kuò)招,使得今年的錄取人數(shù)比往年增加了不少。隨著網(wǎng)絡(luò)和信息技術(shù)的快速發(fā)展,同時(shí)人們想更快地獲取信息的愿望越來(lái)越強(qiáng)烈。這在招生工作中表現(xiàn)比較突出,每年到高考后填報(bào)志愿這段時(shí)間,上網(wǎng)查找招生信息和問(wèn)詢(xún)招生信息的學(xué)生和家長(zhǎng)很多,學(xué)校通常組織多名工作人員守在計(jì)算機(jī)前進(jìn)行問(wèn)題的解答。在招生工作中,很多問(wèn)題是一樣的,如果將訊問(wèn)多的問(wèn)題和答案放

5、入問(wèn)答庫(kù),將常見(jiàn)問(wèn)題讓系統(tǒng)回答,則可以較少工作人員的工作量,同時(shí),也能提高回答問(wèn)題的時(shí)間。</p><p>  互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)上的信息越來(lái)越多。如何在這些海量信息中快速準(zhǔn)確地找到所需要的信息也越來(lái)越困難。雖然現(xiàn)在的搜索引擎已經(jīng)取得了很大的成功,但是這些搜索引擎是被設(shè)計(jì)用來(lái)獲取與用戶(hù)查詢(xún)請(qǐng)求相關(guān)的文檔的,因?yàn)槠洳樵?xún)序列是一系列關(guān)鍵詞的組合,而不是以自然語(yǔ)言的形式提供的,同時(shí)其返回的結(jié)果是與查詢(xún)相關(guān)的網(wǎng)頁(yè)的列表

6、,其中只有一小部分是用戶(hù)需要的信息,而且用戶(hù)必須自己從這些文檔中找到相關(guān)的信息。事實(shí)上,用戶(hù)可能更習(xí)慣于用自然語(yǔ)言來(lái)描述一個(gè)問(wèn)題而不是一系列的關(guān)鍵詞,通常情況下用戶(hù)所需要的只是問(wèn)題的確切答案,而不是與該問(wèn)題相關(guān)的一系列網(wǎng)頁(yè)。另一方面,傳統(tǒng)的問(wèn)答系統(tǒng)雖然可以對(duì)用戶(hù)提出的問(wèn)題給出確定的答案;但是這些問(wèn)答系統(tǒng)的知識(shí)庫(kù)是基于一個(gè)固定的文檔集合,尚且不能滿(mǎn)足用戶(hù)的各種各樣的需求。問(wèn)答系統(tǒng)的目標(biāo)就是解決這些問(wèn)題。由于互聯(lián)網(wǎng)信息的豐富多樣性,毫無(wú)疑問(wèn)

7、可以作為問(wèn)答系統(tǒng)知識(shí)庫(kù)的理想資源。</p><p>  20世紀(jì)90年代以來(lái),Internet在世界范圍內(nèi)得到迅猛的發(fā)展,網(wǎng)上的信息越來(lái)越多,極大地推動(dòng)了自然語(yǔ)言處理技術(shù)的發(fā)展,同時(shí)也對(duì)自然語(yǔ)言處理技術(shù)提出了更高的要求。人們希望在雜亂無(wú)章的網(wǎng)絡(luò)世界中快速準(zhǔn)確地獲得自己想要的信息。自動(dòng)問(wèn)答技術(shù)正是為了滿(mǎn)足人們的這種愿望而發(fā)展起來(lái)的。人們可以用普通的問(wèn)句對(duì)自動(dòng)問(wèn)答系統(tǒng)提問(wèn),自動(dòng)問(wèn)答系統(tǒng)將在語(yǔ)料庫(kù)或者互聯(lián)網(wǎng)中搜索相應(yīng)的

8、答案,然后把答案直接返回給用戶(hù)。這樣用戶(hù)就可以通過(guò)自動(dòng)問(wèn)答系統(tǒng)方便地獲得自己想要的信息。</p><p>  而現(xiàn)在由于高校招生的數(shù)量巨大使得用人工的方法去回答考生的問(wèn)題變成一項(xiàng)浩大的工程。招生問(wèn)答系統(tǒng)就在這個(gè)時(shí)候被提了出來(lái)。</p><p>  目前很多考生對(duì)招生政策有很多問(wèn)題,如果采用人工回答的方式非常不現(xiàn)實(shí),既浪費(fèi)人力物力也得不到很好的效果,如果利用系統(tǒng)本身的知識(shí)庫(kù),以及利用豐富的互

9、聯(lián)網(wǎng)資源作為問(wèn)答系統(tǒng)的知識(shí)庫(kù),完全可以開(kāi)發(fā)出既可以滿(mǎn)足廣大考生和家長(zhǎng)的需求,又可以減輕高等學(xué)校招生咨詢(xún)的壓力的問(wèn)答系統(tǒng)。</p><p><b>  二、主題部分</b></p><p><b>  1.問(wèn)答系統(tǒng)</b></p><p>  常用的問(wèn)題集(FAQ)可以作為自動(dòng)問(wèn)答系統(tǒng)中的一個(gè)組成部分。它把用戶(hù)經(jīng)常提問(wèn)的問(wèn)題

10、和相關(guān)答案保存起來(lái),對(duì)于用戶(hù)輸入的問(wèn)題,可以首先在常文問(wèn)題庫(kù)中查找答案。如果能夠找到相應(yīng)的問(wèn)題,就可以直接將問(wèn)題所對(duì)應(yīng)的答案返回給用戶(hù),而不需要經(jīng)過(guò)問(wèn)題;理解、信息檢索、答案抽取等許多復(fù)雜的處理過(guò)程,提高了效率。國(guó)內(nèi)今年來(lái)在該領(lǐng)域作了一些工作國(guó)內(nèi)的這方面研究還很少[1]。</p><p>  在信息檢索領(lǐng)域,查詢(xún)擴(kuò)展是公認(rèn)的能夠有效提高查全率的技術(shù)之一,“其基本思想是利用與查詢(xún)關(guān)鍵詞相關(guān)的詞語(yǔ)對(duì)查詢(xún)進(jìn)行修正,以找

11、到更多的相關(guān)文檔,提高查全率”[2]。</p><p>  問(wèn)答系統(tǒng)屬于信息檢索的一個(gè)分支,相比傳統(tǒng)的基于關(guān)鍵詞的檢索,它具有更精確的檢索結(jié)果。“自動(dòng)問(wèn)答系統(tǒng)既能用自然語(yǔ)言句子提問(wèn),又能為用戶(hù)直接返回所需的答案,而不是相關(guān)的網(wǎng)頁(yè)。所以說(shuō),問(wèn)答系統(tǒng)能更好的滿(mǎn)足用戶(hù)的檢索需求,能更快地找出用戶(hù)所需的答案。可以說(shuō),問(wèn)答系統(tǒng)就是新一代的搜索引擎?!盵3]。</p><p>  開(kāi)發(fā)基于招生領(lǐng)域的問(wèn)

12、答系統(tǒng)對(duì)現(xiàn)在來(lái)說(shuō)是非常有現(xiàn)實(shí)意義的,此系統(tǒng)應(yīng)該具有以下幾個(gè)優(yōu)勢(shì):</p><p> ?。?)此系統(tǒng)能夠減輕瞬間訪問(wèn)量。具有中國(guó)特色的高考每年考生數(shù)百萬(wàn)之多,考生一半都集中在幾天的時(shí)間訪問(wèn)招生問(wèn)答系統(tǒng),咨詢(xún)有關(guān)填報(bào)志愿的問(wèn)題,而且都是一些關(guān)于學(xué)校的招生政策問(wèn)題,這樣,瞬間訪問(wèn)量很大,還需要及時(shí)正確的回答問(wèn)題。</p><p> ?。?)此系統(tǒng)是基于一定領(lǐng)域開(kāi)發(fā)的。問(wèn)答系統(tǒng)都是針對(duì)某個(gè)領(lǐng)域而開(kāi)

13、發(fā)的,招生問(wèn)答系統(tǒng)也不例外,這樣可以減少相關(guān)算法計(jì)算的復(fù)雜度。</p><p> ?。?)此系統(tǒng)能夠減少回答問(wèn)題的重復(fù)性。目前幾乎所有的大學(xué),在網(wǎng)上招生問(wèn)答的幾天是建立,每天需要很多人來(lái)值班,守在計(jì)算機(jī)前面,隨時(shí)回答考生或家長(zhǎng)的提問(wèn),當(dāng)然,有很多問(wèn)題是重復(fù)的。</p><p>  (4)此系統(tǒng)應(yīng)該具有較強(qiáng)的實(shí)用性和通用性。我國(guó)每所大學(xué)的招生政策大同小異,但是其專(zhuān)業(yè)設(shè)置、優(yōu)勢(shì)學(xué)科卻不盡相同,

14、必須開(kāi)發(fā)出具有通用性的招生問(wèn)答系統(tǒng)。</p><p> ?。?)此系統(tǒng)應(yīng)該具有一定的推廣價(jià)值。我國(guó)大約有1300所大學(xué),在每所大學(xué)的網(wǎng)絡(luò)上都可以安裝這樣的招生問(wèn)答系統(tǒng)。</p><p>  2.國(guó)外典型的招生問(wèn)答系統(tǒng)</p><p>  問(wèn)答系統(tǒng)在80年代的自然語(yǔ)言處理領(lǐng)域曾風(fēng)行一時(shí),因?yàn)門(mén)uring實(shí)驗(yàn)告訴人們?nèi)绻?jì)算機(jī)能夠像人一樣與人進(jìn)行對(duì)話,就可以認(rèn)為計(jì)算機(jī)有

15、智能。但是由于當(dāng)時(shí)的條件限制,所有的實(shí)驗(yàn)都是在非常受限的領(lǐng)域,甚至是固定段落上進(jìn)行的,所以自動(dòng)問(wèn)答一直被限制在特殊領(lǐng)域。此后,由于大規(guī)模文本處理技術(shù)的興起,問(wèn)答系統(tǒng)的研究受到了冷落。</p><p>  最近幾年,隨著網(wǎng)絡(luò)和信息技術(shù)的快速發(fā)展,同時(shí)人們想更快地獲取信息的愿望也重新促進(jìn)了自動(dòng)問(wèn)答技術(shù)的發(fā)展。有越來(lái)越多的公司參與了自動(dòng)問(wèn)答技術(shù)的研究。最近,大量的問(wèn)答系統(tǒng)開(kāi)始出現(xiàn)。這些問(wèn)答系統(tǒng)可以被分為兩類(lèi):一類(lèi)是基于

16、構(gòu)建自己的檢索系統(tǒng)和答案抽取系統(tǒng)。另一類(lèi)是使用WWW作為知識(shí)庫(kù)并且使用通用的搜索引擎(Google等)來(lái)獲得與問(wèn)題相關(guān)的信息然后做進(jìn)一步的處理從而抽取出問(wèn)題的答案。例如,該要回答的問(wèn)題是寫(xiě)入一個(gè)或多個(gè)搜索引擎查詢(xún),然后再發(fā)送到谷歌搜索引擎。由谷歌返回的摘要進(jìn)行評(píng)分對(duì)回答模式也產(chǎn)生的問(wèn)題。類(lèi)似的可行的答案,都聚集在一起,重新評(píng)分基于頻率。 qa42提出的三個(gè)答案得分最高的[4]。</p><p>  國(guó)外出現(xiàn)了一些

17、比較成型的,能為用戶(hù)解答非受限制領(lǐng)域以及特定領(lǐng)域問(wèn)題的問(wèn)答系統(tǒng)。這些典型的問(wèn)答系統(tǒng)有:</p><p> ?。?)AskJeeves[5]:該系統(tǒng)是美國(guó)AskJeeves公司開(kāi)發(fā)的。AskJeeves允許用戶(hù)用自然語(yǔ)言句子提問(wèn),檢索系統(tǒng)會(huì)自動(dòng)分析用戶(hù)的提問(wèn),然后通過(guò)與用戶(hù)的交互進(jìn)一步明確用戶(hù)的真正意圖,這使得用戶(hù)能夠充分表達(dá)自己的檢索要求,這種檢索方式檢索到的網(wǎng)頁(yè)比單純基于關(guān)鍵詞的網(wǎng)頁(yè)更符合用戶(hù)的需求。但是,As

18、kJeeves返回的結(jié)果仍然是網(wǎng)頁(yè),而不是問(wèn)題的直接答案。</p><p> ?。?)Start[6]:是麻省理工學(xué)院開(kāi)發(fā)的問(wèn)答系統(tǒng),于1993年開(kāi)發(fā)發(fā)布在Internet上。該系統(tǒng)是第一個(gè)面向國(guó)際互聯(lián)網(wǎng)的自然語(yǔ)言問(wèn)答系統(tǒng),它能夠回答針對(duì)MIT信息實(shí)驗(yàn)室的地理學(xué)知識(shí)的用戶(hù)提問(wèn)。同時(shí),該系統(tǒng)的答案不局限于文本,也可以是圖片、聲音或者動(dòng)畫(huà)等。Start系統(tǒng)使用主體-關(guān)系-對(duì)象三元組的形勢(shì)存放系統(tǒng)知識(shí)以及回答問(wèn)題,回答

19、問(wèn)題能力非常有限,系統(tǒng)的精確性比較差。同時(shí),該系統(tǒng)是以英文為母語(yǔ)的,只能識(shí)別用英語(yǔ)提交的問(wèn)題。</p><p> ?。?)AnswerBus[7]:也是一個(gè)比較成熟的問(wèn)答系統(tǒng),AnswerBus是一個(gè)多語(yǔ)種的自動(dòng)問(wèn)答系統(tǒng),它不僅可以回答英語(yǔ)的問(wèn)題,還可以回答多國(guó)語(yǔ)言的問(wèn)題。</p><p> ?。?)FAQFind[8]:芝加哥大學(xué)人工智能實(shí)驗(yàn)室開(kāi)發(fā)的FAQFinder。該系統(tǒng)預(yù)先收集FA

20、Q庫(kù),通過(guò)使用語(yǔ)義網(wǎng)分析與概念匹配技術(shù),采用基于向量的搜索引擎從問(wèn)答對(duì)文件中抽取答案。</p><p>  3.國(guó)內(nèi)典型的招生問(wèn)答系統(tǒng)</p><p>  國(guó)內(nèi)的教學(xué)網(wǎng)站一般都具有較好的交互,答疑功能和反饋機(jī)制,并且每個(gè)學(xué)生都由專(zhuān)門(mén)的教室負(fù)責(zé),利用E-mail、傳真、信件、電話等進(jìn)行答疑交流。</p><p>  國(guó)內(nèi)的問(wèn)答系統(tǒng)一般是作為遠(yuǎn)程教學(xué)支撐平臺(tái)的一個(gè)子系統(tǒng)

21、,而不是一個(gè)獨(dú)立的問(wèn)答系統(tǒng)。目前成型的系統(tǒng)中,有一些采用基于人工智能中知識(shí)和推理的方法完成較小規(guī)模的問(wèn)答系統(tǒng),它依賴(lài)于領(lǐng)域知識(shí)庫(kù)的建設(shè)和規(guī)則推理的約束[9]。很多遠(yuǎn)程教學(xué)平臺(tái)知識(shí)提供一些簡(jiǎn)答的答疑方式,并沒(méi)有專(zhuān)門(mén)的答疑系統(tǒng)。這種方式大部分依靠人工來(lái)實(shí)現(xiàn)答疑,這些答疑方式對(duì)于遠(yuǎn)程教育老說(shuō)有很多缺點(diǎn):一是會(huì)耗費(fèi)教師較多的時(shí)間來(lái)答疑,教師經(jīng)常需要重復(fù)回答學(xué)生的一些問(wèn)題;二是答疑經(jīng)常會(huì)延時(shí),有時(shí)學(xué)生提出的疑問(wèn)好長(zhǎng)時(shí)間沒(méi)有回復(fù),這在一定程度上影響

22、了學(xué)生的學(xué)習(xí)積極性和學(xué)習(xí)效率。另外,國(guó)內(nèi)還有一些答疑系統(tǒng)采用較復(fù)雜的技術(shù),實(shí)現(xiàn)了自動(dòng)答疑,克服了以上不足。他們可以分為兩類(lèi)[10]:</p><p>  (1)基于FAQ庫(kù)的智能答疑系統(tǒng)</p><p>  比較典型的是上海交通大學(xué)的遠(yuǎn)程智能答疑系統(tǒng)。該系統(tǒng)的FAQ庫(kù)存儲(chǔ)了用戶(hù)可能提出的問(wèn)答對(duì)。系統(tǒng)根據(jù)用戶(hù)輸入的自然語(yǔ)言句子,自動(dòng)抽取其中的關(guān)鍵詞和庫(kù)中問(wèn)題進(jìn)行關(guān)鍵詞匹配,并將最匹配的問(wèn)題的

23、答案從庫(kù)中返回給用戶(hù)。TREC(Text Retrieval Conference)是國(guó)際上著名的文本檢索會(huì)議,它于1999年第一次設(shè)立QA Track[11]。系統(tǒng)回應(yīng)語(yǔ)料庫(kù)問(wèn)題的不是1字串就是常量字符串“無(wú)或零”。因?yàn)闆](méi)有絕對(duì)保證語(yǔ)料問(wèn)題的文本集合(知識(shí)庫(kù))內(nèi)有答案,當(dāng)系統(tǒng)相信不能找到答案的時(shí)候“無(wú)或零”就被返回給用戶(hù)[12]。哈爾濱工業(yè)大學(xué)也開(kāi)發(fā)過(guò)基于常見(jiàn)問(wèn)題庫(kù)的問(wèn)答系統(tǒng)。與上面介紹的系統(tǒng)不同的是,它考慮了詞語(yǔ)的語(yǔ)義,采用基于語(yǔ)義

24、的橘子相似度計(jì)算方法來(lái)實(shí)現(xiàn)問(wèn)題的答疑。該系統(tǒng)運(yùn)用計(jì)算用戶(hù)問(wèn)題與FAQ庫(kù)中的問(wèn)題的詞語(yǔ)語(yǔ)義相似度,進(jìn)而得到句子之間的相似度,將相似度滿(mǎn)足一定條件的問(wèn)題對(duì)應(yīng)的答案從庫(kù)中返回給用戶(hù)。</p><p> ?。?)基于全文檢索的智能答疑系統(tǒng)</p><p>  基于全文檢索的智能答疑系統(tǒng)主要利用了信息檢索技術(shù)來(lái)實(shí)現(xiàn)答疑。它的特點(diǎn)是知識(shí)庫(kù)不是現(xiàn)成的問(wèn)題答案對(duì),二是相關(guān)文檔庫(kù)。對(duì)用戶(hù)問(wèn)句進(jìn)行自然語(yǔ)言理解

25、后,采用信息檢索技術(shù)對(duì)文檔庫(kù)中的文檔進(jìn)行檢索后,將文檔按與查詢(xún)的相關(guān)度排序輸出,最后系統(tǒng)對(duì)相關(guān)度比較高的文檔采用答案抽取技術(shù)進(jìn)行答案抽取后返回給用戶(hù)。</p><p>  4. 招生問(wèn)答的綜合評(píng)述</p><p>  基于網(wǎng)絡(luò)的系統(tǒng)研究還不是很多。華盛頓大學(xué)的MULDER[13],是第一個(gè)完全以網(wǎng)絡(luò)作為其知識(shí)庫(kù)的自動(dòng)問(wèn)答系統(tǒng),它將檢索到的網(wǎng)絡(luò)文檔下載到本地,并且對(duì)這些文檔進(jìn)行詳細(xì)的語(yǔ)法分析

26、從中抽取答案。新加坡國(guó)立大學(xué)的LAMP[14]是另外一個(gè)MULDER類(lèi)似的系統(tǒng)。</p><p>  針對(duì)目前國(guó)內(nèi)外智能問(wèn)答系統(tǒng)的發(fā)展現(xiàn)狀的發(fā)現(xiàn),主要需要改善的是:</p><p> ?。?)國(guó)內(nèi)的問(wèn)答系統(tǒng)沒(méi)有國(guó)外發(fā)展得快,技術(shù)還不成熟。國(guó)外的問(wèn)答系統(tǒng)已經(jīng)能夠在某些領(lǐng)域發(fā)揮作用。但是由于這些系統(tǒng)都是以英語(yǔ)為背景進(jìn)行研究的,還不能直接移植到中文中。</p><p> 

27、?。?)鑒于現(xiàn)在的問(wèn)答系統(tǒng)對(duì)答疑速度方面都有一定的缺陷?,F(xiàn)在需要設(shè)計(jì)的問(wèn)答系統(tǒng)要把蘊(yùn)涵豐富答疑材料的文檔庫(kù)和常文問(wèn)題庫(kù)相結(jié)合,實(shí)現(xiàn)從文檔中自動(dòng)得到答案的策略。該方案會(huì)使得系統(tǒng)對(duì)常問(wèn)問(wèn)題能快速給出解答,提高了系統(tǒng)的效率和準(zhǔn)確率;同時(shí)還能回答沒(méi)有存儲(chǔ)的大部分問(wèn)題,大大增強(qiáng)系統(tǒng)的問(wèn)答能力和實(shí)用性。同時(shí),系統(tǒng)還應(yīng)該提高問(wèn)答的準(zhǔn)確性和智能性。</p><p>  在信息檢索領(lǐng)域,對(duì)檢索結(jié)果的評(píng)價(jià)通常通過(guò)召回率(Recall

28、,“查全率”)和準(zhǔn)確率(Precision,“正確率”)或者兩者的綜合指標(biāo)來(lái)進(jìn)行評(píng)價(jià)。然而在問(wèn)答系統(tǒng)中,由于在進(jìn)行檢索之后,還需要進(jìn)一步從返回的結(jié)果當(dāng)中進(jìn)行答案的抽取,因此應(yīng)該更側(cè)重于評(píng)價(jià)返回的文本中是否存在含有正確答案的問(wèn)答[15]。</p><p>  通過(guò)上述幾點(diǎn)的描述,可以大致的對(duì)準(zhǔn)入系統(tǒng)有個(gè)整體的了解。怎么客觀而又科學(xué)地評(píng)測(cè)問(wèn)答系統(tǒng)的有關(guān)性能,是一個(gè)很重要的問(wèn)題。一般來(lái)說(shuō),問(wèn)答系統(tǒng)的評(píng)測(cè)標(biāo)準(zhǔn)應(yīng)該包括一下

29、幾個(gè)方面的問(wèn)題:</p><p> ?。?)系統(tǒng)給出的答案應(yīng)該是準(zhǔn)確的。</p><p> ?。?)系統(tǒng)響應(yīng)的時(shí)間越短越好。</p><p> ?。?)系統(tǒng)給出的答案應(yīng)該是全面的。</p><p> ?。?)系統(tǒng)給出的答案應(yīng)該語(yǔ)句流暢,簡(jiǎn)明扼要。</p><p>  問(wèn)答系統(tǒng)需要一個(gè)評(píng)價(jià)幾只來(lái)衡量問(wèn)答系統(tǒng)的性能。首先需

30、要建立一個(gè)測(cè)試集,這個(gè)測(cè)試集是人工做出來(lái)的問(wèn)題和答案的集合。把這個(gè)測(cè)試集中的問(wèn)題提交給問(wèn)答系統(tǒng)。讓問(wèn)答系統(tǒng)自動(dòng)的給出答案。然后把問(wèn)答系統(tǒng)自動(dòng)找出的答案和測(cè)試集中的答案進(jìn)行人工的對(duì)比。如果問(wèn)答系統(tǒng)給出的答案通過(guò)人工的對(duì)比基本正確,則可以判斷這個(gè)答案是正確的,否則可以判斷這個(gè)答案是錯(cuò)誤的。</p><p><b>  三、總結(jié)部分</b></p><p>  招生問(wèn)答系統(tǒng)

31、避免了傳統(tǒng)知識(shí)庫(kù)的結(jié)構(gòu),穩(wěn)定性差的毛病,消耗大量的人力物力,還有傳統(tǒng)的信息檢索和信息提取的正確性不高的特點(diǎn)。招生問(wèn)答系統(tǒng)避免了傳統(tǒng)知識(shí)庫(kù)的結(jié)構(gòu),穩(wěn)定性差的毛病,消耗大量的人力物力,還有傳統(tǒng)的信息檢索和信息提取的正確性不高的特點(diǎn)。 </p><p>  本文主要對(duì)以下方面:1.知識(shí)庫(kù)結(jié)構(gòu)設(shè)計(jì)。知識(shí)庫(kù)一般由基于實(shí)例的問(wèn)答庫(kù)、基于內(nèi)容理解的檢索問(wèn)答庫(kù)、具有人工反饋機(jī)制的問(wèn)答系統(tǒng)三部分組成。2.答案提取研究。答案提取是問(wèn)

32、答系統(tǒng)的主要模塊,答案提取有許多方式和方法。3.問(wèn)題模塊研究。對(duì)問(wèn)題的分析,尋找合適的算法可以有效的正確找到所需要的答案。4.問(wèn)答系統(tǒng)設(shè)計(jì)。本文提出了基于招生領(lǐng)域的問(wèn)答系統(tǒng),完成了系統(tǒng)的設(shè)計(jì)架構(gòu)和流程。</p><p><b>  四、參考文獻(xiàn)</b></p><p>  [1] BURKE R D,HAMMOND K J,KULYUKIN V, et al. Que

33、stion Answering from Frequently Asked Question Files:Experiences with the FAQ Finder Systemp [J].AI Magazine,1997,18;57-66.</p><p>  [2] 田萱,杜小勇,李海華.語(yǔ)義查詢(xún)擴(kuò)展中詞語(yǔ)-概念相關(guān)度計(jì)算[J].軟件學(xué)報(bào),2008,19(8):2043-2053.</p>

34、<p>  [3] 鄭實(shí)福,劉挺,秦兵等.中文自動(dòng)問(wèn)答系統(tǒng)綜述[J].中文信息學(xué)報(bào),2002,6(16):46-52.</p><p>  [4] Jyotika Prasad,Antone R,Vogt Riku Inoue.qa42:Web-Based Question Answering System[C].CS224N Final Programming Assignment,1-11.<

35、/p><p>  [5] 王樹(shù)西,劉群,白碩.問(wèn)答系統(tǒng)研究綜述.中文信息學(xué)報(bào),2002,16(6):46-52.</p><p>  [6] 陸汝鈐.世紀(jì)之交的知識(shí)工程與知識(shí)科學(xué).北京:清華大學(xué)出版社,2001.</p><p>  [7] 況立群,韓燮.基于對(duì)象的XML知識(shí)表示方法[期刊論文]-華北工學(xué)院學(xué)報(bào),2002,23(6).</p><p&

36、gt;  [8] 陳新中,藺麗華,王道平.面向?qū)ο蟮闹R(shí)表示方法研究[期刊論文]西安礦業(yè)學(xué)院學(xué)報(bào) 1999,19(4).</p><p>  [9] 王樹(shù)西,劉群,白碩.基于動(dòng)態(tài)知識(shí)庫(kù)的問(wèn)答系統(tǒng)研究[M]語(yǔ)言計(jì)算與基于內(nèi)容的文本處理,北京:清華大學(xué)出版社,2003:587-592.</p><p>  [10] 武旭,須德.基于向量空間模型的文本自動(dòng)分類(lèi)系統(tǒng)的研究與實(shí)現(xiàn)[期刊論文]-北方交

37、通大學(xué)學(xué)報(bào),2003,27(2).</p><p>  [11] E.Voorhees.Overview of the TREC-9 Question Answering Track[A].In:Proceedings of the 9th Text Retrieval Conference(TREC9)[C],NIST,Gaithersburg,MD,2000,71-80.</p><p&g

38、t;  [12] Hoa Trang Dang1,Diane Kelly2,and Jimmy Lin. Overview of the TREC 2007 Question Answering Tarck[J].ACL 2003 Workshop on Multilingual Summarization and Question Answering[C].Morristown,USA:Association for Computat

39、ionalLinguistics,2003,61-68.</p><p>  [13] C.Kwork,O.Etzioni,and D.S.Weld.Scaling Question Answering to the Web[A]. In:Proceedings of the 10th World Wide Web Conference(WWW2001)[C], Hong Kong,2001,150-161.&l

40、t;/p><p>  [14] Dell Zhang,Wee Sun Lee. A Web-based Question Answering System[A].In:Proceedings of the SMA Annual Symposium 2003[C],NUS,Singapore,Jan 2003.</p><p>  [15] 余正濤,樊孝忠,宋麗榮.基于特定問(wèn)題類(lèi)別的漢語(yǔ)問(wèn)答系

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論