2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2006年5月第5期May2006No5論網(wǎng)絡(luò)環(huán)境下情報(bào)檢索語(yǔ)言的發(fā)展趨勢(shì)易紅’徐軍華李金波(1湖北民族學(xué)院,恩施445000’;2武漢大學(xué)中國(guó)科學(xué)評(píng)價(jià)研究中心,武漢430072;3華南師范大學(xué)經(jīng)濟(jì)與管理學(xué)院,廣州510631)[摘要]論述了網(wǎng)絡(luò)環(huán)境下采用自然語(yǔ)言是必然趨勢(shì),然而自然語(yǔ)言井不會(huì)成為網(wǎng)絡(luò)環(huán)境下的惟一檢索語(yǔ)言,自然語(yǔ)言爭(zhēng)人工語(yǔ)言相結(jié)合才是發(fā)展的方向。【關(guān)鍵制】網(wǎng)絡(luò)環(huán)境;情報(bào)檢索語(yǔ)言;自然語(yǔ)言;人工語(yǔ)言【st髓d]dspape

2、rdiscussesthattheuseofnatulltllanguageisnecessaryundernetworkenvironmentbutlla~a]languagewillnotbetheexclusiveretrievallanguageThedevd0pingtrendofinformationretrievall/tngLlageisthecombinationofnatura1]Jlllguageandartifi

3、ciallanguage【Keywords]networkenvironment;informationretrievallanguage;natl1ra]language;artificiallanguage[中圖分類(lèi)號(hào))G254[文獻(xiàn)標(biāo)識(shí)碼)A[文章編號(hào))1008—0821(2OO6)05—0013—02情報(bào)檢索語(yǔ)言是情報(bào)檢索的保證,其發(fā)展同科學(xué)技術(shù)的進(jìn)步、社會(huì)環(huán)境及用戶需求密切相關(guān)。進(jìn)入新世紀(jì)以來(lái)互聯(lián)網(wǎng)絡(luò)已基本在全球得到普及,基于

4、手工檢索而產(chǎn)生的人工語(yǔ)言,面對(duì)著網(wǎng)絡(luò)信息資源的浩瀚海洋、多種多樣的用戶檢索需求以及計(jì)算機(jī)技術(shù)的進(jìn)一步應(yīng)用和發(fā)展,已經(jīng)越來(lái)越暴露出它的弱點(diǎn),回歸自然語(yǔ)言的呼聲越來(lái)越高。這里筆者不禁要問(wèn),網(wǎng)絡(luò)環(huán)境下人工語(yǔ)言會(huì)完全失去用武之地嗎,自然語(yǔ)言會(huì)完全取代人工語(yǔ)言成為網(wǎng)絡(luò)環(huán)境下信息檢索的惟一工具嗎這個(gè)問(wèn)題也是近些年來(lái)情報(bào)語(yǔ)言學(xué)界討論的熱點(diǎn)。l網(wǎng)絡(luò)環(huán)境下采用自然語(yǔ)言是必然趨勢(shì)11網(wǎng)絡(luò)環(huán)境的特點(diǎn)及其對(duì)情報(bào)檢索語(yǔ)言的要求111信息海量且載體電子化網(wǎng)絡(luò)上的海

5、量信息一直是人們所津津樂(lè)道的,但同時(shí)也是令人們很頭疼的一件事。網(wǎng)絡(luò)上信息包羅萬(wàn)象,類(lèi)型多種多樣,而且新的類(lèi)型不斷涌現(xiàn),即使是經(jīng)過(guò)加工的機(jī)讀數(shù)據(jù)也是數(shù)以萬(wàn)計(jì),包括書(shū)目數(shù)據(jù)庫(kù)、數(shù)值數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)、圖像數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)等等,它們逐漸取代印刷型二次文獻(xiàn)。另外,電子出版物也是急劇增長(zhǎng)。面對(duì)這些,即使是專(zhuān)業(yè)人員有時(shí)都難以檢索到自己所需的信息,更別提用戶了,人們呼喚檢索語(yǔ)言出現(xiàn)新局面:由難以容納新類(lèi)目的分類(lèi)語(yǔ)言為主走向以敘詞語(yǔ)言、自然語(yǔ)言為主

6、;由使用單一的檢索語(yǔ)言并用或混用。112信息資源的網(wǎng)絡(luò)化、共享化隨著信息技術(shù)的進(jìn)步和互聯(lián)網(wǎng)絡(luò)的日益完善全球網(wǎng)絡(luò)用戶發(fā)展迅速,達(dá)到上億,信息資源的跨國(guó)流動(dòng)、各國(guó)之間的科技文化交流日益頻繁,全球共享著一個(gè)因特網(wǎng)。在這樣的計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中,檢索語(yǔ)言(分類(lèi)表、詞表)的使用對(duì)象由原先的專(zhuān)業(yè)標(biāo)引人員和檢索人員擴(kuò)大到專(zhuān)業(yè)不同、層次不一的廣大終端用戶。各國(guó)所采用的情報(bào)檢索語(yǔ)言不同,標(biāo)識(shí)方法各異,分類(lèi)表、詞表的兼容性差,而且傳統(tǒng)的分類(lèi)語(yǔ)言和主體語(yǔ)言還存在

7、標(biāo)引難度大、速度慢、詞匯更新滯后、對(duì)標(biāo)引和檢索人員要求過(guò)高等弊端,在網(wǎng)絡(luò)環(huán)境中,這些弊端已明顯的暴露出來(lái)。網(wǎng)絡(luò)環(huán)境下用戶的變化也呼喚著兼容性強(qiáng)、易用的自然語(yǔ)言的登臺(tái)亮相。113檢索方式的多樣化以及技術(shù)的現(xiàn)代化網(wǎng)絡(luò)環(huán)境下,虛擬圖書(shū)館已成為現(xiàn)實(shí),信息用戶已不必親自去圖書(shū)館借閱書(shū)刊,坐在計(jì)算機(jī)終端前利用網(wǎng)絡(luò)進(jìn)行居家檢索成為潮流,如此勢(shì)必要求用最符合他們習(xí)慣的語(yǔ)言來(lái)進(jìn)行檢索。人們的情報(bào)檢索行為也不再僅是手工檢索時(shí)代占主導(dǎo)的“提問(wèn)——檢索式”、“

8、瀏覽——檢索式”已盛行,表現(xiàn)出了更多的隨意性和自然性。同時(shí)。檢索技術(shù)也越來(lái)越先進(jìn),超文本、多媒體、全文檢索等技術(shù)及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展和運(yùn)用,使檢索語(yǔ)言詞匯的兼容和互換成為現(xiàn)實(shí),也為自然語(yǔ)言的應(yīng)用開(kāi)拓了廣闊的前景。12自然語(yǔ)言的優(yōu)越性通常所說(shuō)的自然語(yǔ)言是指人們?nèi)粘Uf(shuō)話、寫(xiě)文章和思想交流的各種語(yǔ)言。在情報(bào)檢索中應(yīng)用自然語(yǔ)言其實(shí)質(zhì)是使用文獻(xiàn)作者或文摘編寫(xiě)者原來(lái)所用的語(yǔ)詞,或標(biāo)引人員自擬的而不是取自詞表的語(yǔ)詞來(lái)作為文獻(xiàn)檢索標(biāo)識(shí),包括關(guān)鍵詞、自

9、由詞和出現(xiàn)在文獻(xiàn)題名、文獻(xiàn)中的小標(biāo)題和章節(jié)名、文摘或正文中的語(yǔ)詞。過(guò)去在手工檢索條件下,自然語(yǔ)言在情報(bào)檢索中很難應(yīng)用,人工語(yǔ)言正是基于此而創(chuàng)造,可是在檢索計(jì)算機(jī)化網(wǎng)絡(luò)化的條件下,自然語(yǔ)言的優(yōu)勢(shì)卻凸顯出來(lái):121自然語(yǔ)言是文獻(xiàn)作者的書(shū)面語(yǔ)言,用作情報(bào)檢索能客觀的反映文獻(xiàn)的主題內(nèi)容,可以避免由于文獻(xiàn)分析標(biāo)引的誤差和人工語(yǔ)言的粗化所造成的標(biāo)識(shí)表達(dá)文獻(xiàn)主題的失真,更好的體現(xiàn)了文獻(xiàn)保障原則。122符合用戶習(xí)慣,具有易用性,檢索方便、簡(jiǎn)單。用戶直接

10、以日常使用的語(yǔ)言(只要不脫離文獻(xiàn)中的主要自然語(yǔ)言)便可以任意檢索,既不受詞表控制。也毋需培訓(xùn)。如此較易激發(fā)檢索者的熱情,取得更佳的檢索效果。123自然語(yǔ)言符合客觀發(fā)展需要,它可以不受限制的隨收稿日期:2O05—O8一l6作者簡(jiǎn)介:易紅,現(xiàn)在湖北民族學(xué)院圖書(shū)館工作。徐軍華(1979一)。男,武漢大學(xué)信息管理學(xué)院2003級(jí)研究生。研究方向:知識(shí)管理,發(fā)表論文6篇。李金波(198O一)。男。華南師范大學(xué)經(jīng)濟(jì)與管理學(xué)院信息管理系碩士研究生。一l

11、3一理論探索維普資訊理論探索2006年5月第5期May2006No5時(shí)輸入新詞,因而能容納新類(lèi)目,較容易跟蹤學(xué)科的發(fā)展。124自然語(yǔ)言能達(dá)到足夠的專(zhuān)指度,它可以使用文摘、索引或文獻(xiàn)正文中出現(xiàn)的任何一個(gè)具有實(shí)際意義的詞進(jìn)行檢索,甚至可以指定檢索的詞在某一段落或某一句子中出現(xiàn)。因而有較好的查準(zhǔn)率。125自然語(yǔ)言標(biāo)引簡(jiǎn)便,可以取消費(fèi)時(shí)費(fèi)力的標(biāo)引工作,或至少可以降低標(biāo)引工作的難度和成本,標(biāo)引和建庫(kù)速度快,也易于實(shí)現(xiàn)自動(dòng)化。126通用性好。自然語(yǔ)

12、言具有通用性,可以避免由于標(biāo)引人員的素質(zhì)和理解、判斷等方面的差異而造成的歸類(lèi)和選詞的不同,因而消除了人工語(yǔ)言的兼容性問(wèn)題,易于實(shí)現(xiàn)資源共享。綜上所述,自然語(yǔ)言憑借其突出的優(yōu)點(diǎn),順應(yīng)了網(wǎng)絡(luò)環(huán)境的特點(diǎn)及其對(duì)情報(bào)檢索語(yǔ)言提出的要求,成為網(wǎng)絡(luò)環(huán)境下情報(bào)檢索語(yǔ)言發(fā)展的必然趨勢(shì)。目前國(guó)外網(wǎng)絡(luò)信息檢索中自然語(yǔ)言的應(yīng)用占著主要地位,幾乎所有網(wǎng)絡(luò)信息檢索工具都提供關(guān)鍵詞(自然語(yǔ)言)途徑,就是例證。然而問(wèn)題在于,自然語(yǔ)言是否會(huì)成為網(wǎng)絡(luò)環(huán)境下的惟一檢索語(yǔ)言,

13、人工語(yǔ)言是否已失去其使用價(jià)值,我們應(yīng)該專(zhuān)注于自然語(yǔ)言而削弱甚至放棄人工語(yǔ)言的研究嗎2自然語(yǔ)言不會(huì)成為網(wǎng)絡(luò)環(huán)境下的惟一檢索語(yǔ)言21自然語(yǔ)言完美嗎自然語(yǔ)言有著眾多的優(yōu)點(diǎn),這筆者在上面已經(jīng)論述過(guò),但這并不代表自然語(yǔ)言是完美的,沒(méi)有缺陷。事實(shí)上,自然語(yǔ)言的最大優(yōu)點(diǎn)——不作詞匯規(guī)范和詞間關(guān)系顯示,也是它的最大缺點(diǎn):211自然語(yǔ)言表達(dá)概念的自由度很大,不僅存在著許多同義詞和近義詞,而且還存在著大量同義和近義的詞組,除一般同義詞(組)外,有學(xué)名和俗稱(chēng)

14、、新稱(chēng)和舊稱(chēng)、全稱(chēng)和簡(jiǎn)稱(chēng)、不同譯名、不同書(shū)寫(xiě)形式的詞、一般近義詞(組)等等。這些詞(組)在文獻(xiàn)中的存在,造成檢索內(nèi)容的嚴(yán)重分散,對(duì)檢全率的影響相當(dāng)大。212自然語(yǔ)言中還存在著大量多義詞和同形異義詞,會(huì)影響檢準(zhǔn)率。這對(duì)專(zhuān)業(yè)數(shù)據(jù)庫(kù)來(lái)說(shuō)影響不會(huì)很大,但用戶檢索綜合性數(shù)據(jù)庫(kù)時(shí),往往會(huì)感到頭疼。213自然語(yǔ)言標(biāo)引不采用詞表,對(duì)這些大量存在著的同義詞、近義詞、多義詞及其他相關(guān)關(guān)系的詞匯沒(méi)有進(jìn)行規(guī)范和詞間關(guān)系顯示,因而無(wú)法利用詞匯間的語(yǔ)義關(guān)系網(wǎng)來(lái)進(jìn)行

15、縮檢和擴(kuò)檢,影響查全率。另外,由于選詞沒(méi)有嚴(yán)格限制,詞量勢(shì)必過(guò)多過(guò)雜,造成主題分散,相關(guān)文獻(xiàn)也不能集中,影響查全率和查準(zhǔn)率。自然語(yǔ)言的這些缺陷,使得它在情報(bào)檢索中的應(yīng)用面臨著兩個(gè)難題:“一是如何從自然語(yǔ)言文本中抽出最能準(zhǔn)確、充分的表達(dá)文獻(xiàn)有價(jià)值內(nèi)容的詞,以及這些詞與檢索課題有效匹配的問(wèn)題;二是克服自然語(yǔ)言由于不規(guī)范和缺乏語(yǔ)義關(guān)聯(lián)性而對(duì)檢索不利的問(wèn)題?!边@兩個(gè)難題的克服都不能完全靠自動(dòng)化的方法,而又要以人工語(yǔ)言,利用人工語(yǔ)言的長(zhǎng)處來(lái)解決。

16、,22人工語(yǔ)言已成昨日黃花了嗎誠(chéng)然,計(jì)算機(jī)和網(wǎng)絡(luò)檢索的發(fā)展使人工語(yǔ)言的缺點(diǎn)暴露無(wú)遺:人工語(yǔ)言標(biāo)引速度慢,遠(yuǎn)遠(yuǎn)跟不上數(shù)量龐大的網(wǎng)絡(luò)信息資源的增長(zhǎng)速度;處理時(shí)差大,不能及時(shí)反映最新發(fā)布的信息;對(duì)新學(xué)科、新技術(shù)和新方法等出現(xiàn)的新生詞無(wú)法標(biāo)引;標(biāo)引規(guī)則復(fù)雜,標(biāo)引難度大,對(duì)標(biāo)引人員要求高,一般用戶使用困難等。許多人也正是基于此認(rèn)為人工語(yǔ)言不適合于標(biāo)引檢索網(wǎng)絡(luò)信息資源,認(rèn)為人工語(yǔ)言將被一14~淘汰。這種觀點(diǎn)的正確性是值得懷疑的,他們忽略了人工語(yǔ)言還

17、有著許多優(yōu)點(diǎn):221能簡(jiǎn)單明白又比較專(zhuān)指的表達(dá)文獻(xiàn)以及檢索課題的主題概念,并且容易將概念進(jìn)行系統(tǒng)排列,在檢索時(shí)便于將標(biāo)引用語(yǔ)與檢索用語(yǔ)進(jìn)行相符性比較;222詞匯規(guī)范,語(yǔ)詞與概念一一對(duì)應(yīng),能控制同義詞、近義詞、多義詞和相關(guān)詞,減少語(yǔ)義含混現(xiàn)象,促進(jìn)主題表達(dá)的一致性,提高查準(zhǔn)率;223進(jìn)行詞間關(guān)系顯示,表達(dá)概念之間的關(guān)系,便于進(jìn)行上位擴(kuò)檢、下位縮檢和相關(guān)檢索,獲得較高的查全率。歸納到一點(diǎn),人工語(yǔ)言的最大優(yōu)點(diǎn)就是:使用它標(biāo)引的數(shù)據(jù)庫(kù)檢索效率(

18、查全率和查準(zhǔn)率)相當(dāng)高。這正是自然語(yǔ)言的致命缺點(diǎn),也是標(biāo)引檢索人員和用戶追求的首要目標(biāo)。“一些經(jīng)過(guò)信息工作者標(biāo)引的專(zhuān)業(yè)數(shù)據(jù)庫(kù)它們的檢索功能和效果都是現(xiàn)有網(wǎng)絡(luò)信息檢索工具望塵莫及的”,這些網(wǎng)絡(luò)信息檢索工具如搜索引擎都主要是使用關(guān)鍵詞(自然語(yǔ)言)檢索。而目前為了對(duì)網(wǎng)絡(luò)環(huán)境下的數(shù)字信息進(jìn)行描述與組織而大力開(kāi)發(fā)的元數(shù)據(jù),也是對(duì)“人工語(yǔ)言不適合于網(wǎng)絡(luò)環(huán)境”的觀點(diǎn)的否定??梢?jiàn),人工語(yǔ)言非但不會(huì)成為昨B黃花,還應(yīng)該加強(qiáng)研究。一句話,網(wǎng)絡(luò)環(huán)境下的信息檢

19、索不會(huì)使用惟一的自然語(yǔ)言,還必須使用人工語(yǔ)言。3自然語(yǔ)言和人工語(yǔ)言相結(jié)合才是發(fā)展的方向從以上對(duì)自然語(yǔ)言和人工語(yǔ)言各自?xún)?yōu)缺點(diǎn)的分析,純粹的自然語(yǔ)言檢索在實(shí)際中是不可行的,單純的人工語(yǔ)言也難以應(yīng)付網(wǎng)絡(luò)環(huán)境下的信息檢索,但是兩者結(jié)合起來(lái)就不一樣了:自然語(yǔ)言可以解決人工語(yǔ)言時(shí)差大、不靈活、使用困難等問(wèn)題,而人工語(yǔ)言憑借其控制作用可以解決自然語(yǔ)言檢索效率不高等問(wèn)題。實(shí)際上,也已經(jīng)出現(xiàn)了二者相結(jié)合的方法,就是二者的對(duì)應(yīng)轉(zhuǎn)換,人口詞表、后控制詞表就是

20、為了實(shí)現(xiàn)這種轉(zhuǎn)換而編制的詞表。但是,目前這些對(duì)應(yīng)轉(zhuǎn)換詞表的水平和編制的自動(dòng)化程度并不高,還有待進(jìn)一步研究。綜上,在網(wǎng)絡(luò)環(huán)境下,自然語(yǔ)言檢索將被廣泛應(yīng)用,人工語(yǔ)言將成為對(duì)自然語(yǔ)言強(qiáng)有力的后控制手段,依然有它的發(fā)展前途,檢索語(yǔ)言應(yīng)朝著并且必然朝著自然語(yǔ)言和人工語(yǔ)言相結(jié)合的方向發(fā)展。其中,我們可以清楚的看到這樣一點(diǎn):自然語(yǔ)言和人工語(yǔ)言的優(yōu)(缺)點(diǎn)反映在對(duì)方身上便變成了其缺(優(yōu))點(diǎn),二者具有很強(qiáng)的互補(bǔ)性。參考文獻(xiàn)[1]張琪玉情報(bào)檢索語(yǔ)言的發(fā)展趨

21、勢(shì)(與吳建中的對(duì)話)[J]圖書(shū)館雜志,1996,(4):29—32[2]儲(chǔ)荷婷等Intemet網(wǎng)絡(luò)信息檢索——原理工具技巧[M]北京:清華大學(xué)出版社,199910[3]張琪玉網(wǎng)絡(luò)信息檢索用語(yǔ)言的發(fā)展趨勢(shì)[J]圖書(shū)館雜志,200l,(3):5—7,22[4]趙英莉聯(lián)網(wǎng)環(huán)境中的情報(bào)檢索語(yǔ)言研究[J]圖書(shū)情報(bào)工作,1998,(5):9—12[5]寇均鋒論情報(bào)檢索語(yǔ)言的自然語(yǔ)言化發(fā)展趨勢(shì)[J]中國(guó)圖書(shū)館學(xué)報(bào),1999,(3):28—31[6]張

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論