版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第二節(jié) 信息檢索的基礎(chǔ)知識,2.1 信息檢索的概念廣義:指將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要檢出所需信息的過程。包括信息存儲和信息檢索兩個過程。信息存儲:將大量無序的信息集中起來,根據(jù)其外表特征和內(nèi)容特征,經(jīng)過加工,使其系統(tǒng)化、有序化,并按一定的技術(shù)要求建成一個具有檢索功能的工具或系統(tǒng)。 外表特征:題名、著者、出版事項等 內(nèi)容特征:分類號、主題詞等 信息檢索:指運用編制好的檢索工具或系統(tǒng),從信息集合中
2、查找并獲取與用戶提問相關(guān)的信息的過程 。,——狹義,,信息源,篩選信息,概念分析,概念轉(zhuǎn)換成檢索語言-標(biāo)引,信息檢索系統(tǒng),概念轉(zhuǎn)換成檢索語言-提問,概念分析,需求分析,信息用戶,檢索策略,,,,,,,,存儲過程,檢索過程,,信息檢索原理,,,檢索結(jié)果,,2.2 信息檢索的類型 根據(jù)檢索對象的不同,信息檢索分為:,,信息檢索的類型,文獻檢索與數(shù)據(jù)檢索、事實檢索的關(guān)系,文獻檢索:相關(guān)性檢索,只檢索出包含所需知
3、識信息的文獻,不直接解答用戶所提出的具體問題。數(shù)據(jù)檢索、事實檢索:確定性檢索,檢索出包含在文獻中的知識信息,檢索結(jié)果可供用戶直接利用。通常,文獻檢索通過二次文獻來實現(xiàn),是信息檢索中最基本、最主要的形式。而數(shù)據(jù)與事實檢索則一般是通過三次文獻來完成。,2.3 信息檢索工具2.3.1 概述 指用來存儲、報道和查找各類信息線索或特定數(shù)據(jù)和事實的工具或系統(tǒng)?!≈饕ǎ?(1)二次、三次印刷型手工檢索工具 (2)面向計算機
4、和網(wǎng)絡(luò)的各種數(shù)據(jù)庫檢索系統(tǒng) (3)搜索引擎等網(wǎng)絡(luò)檢索工具,2.3.2 檢索工具的作用 a. 報道作用:報道已經(jīng)公開或發(fā)表的相關(guān)領(lǐng)域的信息及線索。 b. 存儲作用:將已經(jīng)公開或發(fā)表的信息及線索按一定方式存儲起來,供用戶檢索利用。 c. 檢索作用:供讀者查找信息及線索。,信息檢索工具,2.4 二次文獻的分類分類:目錄、題錄、文摘、索引(1) 目錄(Catalog):是以“本”為報道單位,它主要用于反
5、映文獻(圖書、期刊等)的出版情況或收藏情況,揭示文獻外部特征(題名、著者、出版事項等)的檢索工具。 例:館藏目錄:反映一個圖書館文獻收藏情況的目錄?! ÷?lián)合目錄:反映一個地區(qū)或一個系統(tǒng)甚至全國或世界范圍的圖書館、信息服務(wù)機構(gòu)文獻收藏情況的一種統(tǒng)一目錄。,石家莊鐵道大學(xué)圖書館館藏目錄,點擊題名可查看館藏地址。,二次文獻,中國高等教育文獻保障系統(tǒng)(Calis)聯(lián)合目錄,點擊題名可查看該文獻信息及收藏單位。,(2) 題錄(Title):
6、是以 “篇” 為報道單位,揭示文獻(期刊論文、會議論文、學(xué)位論文、圖書章節(jié)等)外部特征(篇名、作者、出處等)的檢索工具。,《中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫》中的部分題錄信息,《CCC》中的部分題錄信息,二次文獻,(3) 文摘(Abstract):也是以 “篇” 作為報道單位,描述文獻外部特征和內(nèi)容特征的檢索工具。比題錄多了一個內(nèi)容摘要項。,《中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫》中的部分文摘信息,《SCI》中的部分文摘信息,二次文獻,(4) 索引(Ind
7、ex):是將文獻中具有檢索意義的事項,按照一定方式有序編排起來,供讀者查檢使用的一種附屬性的檢索工具,通常稱為輔助索引,起指引作用。常用的索引類型有:分類索引、主題索引、著者索引、引文索引等。,二次文獻,,超星數(shù)字圖書館的分類索引,EI的 主題詞(受控詞)索引,EI的作者索引,SCI的某篇文章的引文索引,2.5 文獻檢索的方法,(1) 追溯法 指以已有的文獻后面所附的參考文獻為線索查找相關(guān)文獻的方法。 向前追溯法:從一篇有價值的
8、論文出發(fā),利用其后所附的參考文獻,查找其引用了哪些文獻。由近及遠的回溯,越查越深,獲取更多相關(guān)文獻?!獊睚?向后追溯法:找到一篇有價值的論文后,進一步查找該論文被哪些其它文獻引用過。由遠及近地追尋,越查資料越新,研究也就越深入?!ッ} 美國《科學(xué)引文索引(SCI)》通過揭示文獻的引用與被引用關(guān)系來報道文獻。,文獻檢索方法,(2) 常用法:利用常規(guī)檢索工具查找有關(guān)文獻的方法 順查法 按課題的起始年代,按時
9、間順序由遠及近逐年查找。用于掌握課題研究的進展及過程,一般用于撰寫研究綜述。 倒查法 以當(dāng)前時間為起點,由近及遠逐年查找文獻。一般用于新開課題,以便掌握最近一段時間該課題達到的水平及研究動向。 抽查法 根據(jù)課題所屬學(xué)科研究發(fā)展的某一高峰時期,抽出一個時間段,進行集中查找。,文獻檢索方法,(3) 綜合法(循環(huán)法或分段法) 常用法+追溯法。即利用常用法檢索出一批有用文獻,然后利用這些文獻所附的參考文獻由近及遠,或這些文獻被引用
10、情況由遠及近地查找。如此分段交替循環(huán)進行,從而可得到大量相關(guān)文獻。,文獻檢索方法,2.6 文獻檢索的途徑,指利用文獻的各種特征——檢索標(biāo)識,通過檢索工具查找所需文獻的過程。 (1)分類途徑 按文獻內(nèi)容所屬的學(xué)科類別來檢索文獻,使用的檢索語言是分類語言。分類法體現(xiàn)知識的系統(tǒng)性,它能把同一學(xué)科的信息集中在一起。,中國知網(wǎng):分類號TU37——混凝土結(jié)構(gòu)方面的文章,,(2)主題途徑 從文獻內(nèi)容的主題概念出發(fā),按確定的主題詞來檢索文獻
11、 主題法打破了傳統(tǒng)的學(xué)科分類的框框,把分散于各個學(xué)科的有關(guān)信息集中于同一主題詞之下。,文獻檢索途徑,EI:主題詞Civil Engineering——土木工程方面的文章,,文獻檢索途徑,(3)題名途徑 書名、刊名、篇名等(4)關(guān)鍵詞途徑(5)作者途徑(5)機構(gòu)途徑(6)引文途徑 從文獻的引用和被引用關(guān)系查找相關(guān)文獻。(7)代碼途徑 文獻號碼(報告號、專利號、標(biāo)準(zhǔn)號等) (8)其他途徑 例:美國《化學(xué)文摘》中的“分子
12、式索引”,一、概述二、分類語言三、關(guān)鍵詞語言四、主題詞語言,第三節(jié) 檢索語言,3.1 概述 檢索語言是根據(jù)文獻信息的存儲和檢索的需要而創(chuàng)制的一種人工語言,又稱檢索標(biāo)識?!⌒畔⒋鎯Γ河脕砻枋鑫墨I的內(nèi)容特征和外部特征,形成檢索標(biāo)識?!⌒畔z索:用來描述檢索提問,形成提問標(biāo)識?!‘?dāng)提問標(biāo)識與檢索標(biāo)識完全匹配或部分匹配時,即可命中所需文獻信息。,檢索語言,自然語言,檢索語言的分類,描述內(nèi)容特征語言,分類號,檢索語言,主題詞(敘詞
13、),,,,描述外表特征語言,關(guān)鍵詞,檢索語言,人工語言,,分類語言,,題名(書名/刊名/篇名)著者(作者)出版事項(出版者、出版地)代碼(標(biāo)準(zhǔn)號、專利號、報告號、 ISBN號、ISSN號),,3.2 分類語言,檢索語言,按學(xué)科范疇從上至下、從總體到局部層層劃分、展開,形成一種直接體現(xiàn)知識分類的等級制概念的標(biāo)識系統(tǒng)?!∶總€學(xué)科類目都用相對固定的代碼作為標(biāo)識——分類號 每一個分類號代表一個特定的知識概念?!√攸c:集中體
14、現(xiàn)學(xué)科的系統(tǒng)性,反應(yīng)事物的從屬、派生關(guān)系,便于按學(xué)科門類進行族性檢索。 最常見的是體系分類語言,3.2.1 體系分類語言 國內(nèi): 《中國圖書館分類法》(簡稱“中圖法”) 《中國科學(xué)院圖書館分類法》(簡稱“科圖法”) 《中國人民大學(xué)圖書館分類法》(簡稱“人大法”)。 國外: 《杜威十進分類法》 《國際十進分類法》等 《中國圖書館分類法》是國家推薦統(tǒng)一使用的分類法,分類語言,3.2.2 中圖分類表的結(jié)構(gòu)(1) 基本部類
15、 (5個)(2) 基本大類 (22個)(3) 簡表(4) 詳表(5) 輔助表,分類語言,《中國圖書館分類法》,,分類語言,《中國圖書館分類法》,,分類語言,其中“T工業(yè)技術(shù)”大類范圍廣泛,內(nèi)容繁多,故又在該類基礎(chǔ)上采用了雙位拉丁字母標(biāo)記其所屬的16個二級類目。,分類語言,簡表:又稱為基本類目表,是分別對每個基本大類,依據(jù)它的某些屬性,作進一步劃分后而形成的二、三級類目表 。 如:O 數(shù)理科學(xué)和化學(xué) 一
16、度劃分: O1 數(shù)學(xué) O3 力學(xué) O4 物理學(xué) O6 化學(xué) O7 晶體學(xué),分類語言,O1 數(shù)學(xué),二度劃分: O11 古典數(shù)學(xué)O12 初等數(shù)學(xué)O13 高等數(shù)學(xué)O14 數(shù)理邏輯、數(shù)學(xué)基礎(chǔ)O15 代數(shù)、數(shù)論、組合理論O17 數(shù)學(xué)分析O18 幾何、拓撲O19 動力系統(tǒng)理論……,分類語言,詳表:整個分類法的正文,亦稱正表
17、,由簡表進一步細分而成的最小概念性分類表,是類分信息資料的依據(jù),兩萬個。 O17 數(shù)學(xué)分析 O171 分析基礎(chǔ) O172 微積分 O172.1 微分學(xué) O172.2 積分學(xué),分類語言,《中國圖書館分類法》,,分類語言,3.2.3 杜威十進分類法(DDC),世界上流傳最廣影響最大的分類法 在美國有95%的公共圖書館在
18、使用,分類語言,DDC第21版的類目共有10大類,000 計算機、信息與總類100 哲學(xué)和心理學(xué)200 宗教300 社會科學(xué)400 語言500 科學(xué)(指自然科學(xué))600 技術(shù)應(yīng)用科學(xué)700 藝術(shù)和娛樂800 文學(xué)900 歷史、地理,分類語言,3.3 主題詞語言,定義:國外稱敘詞,是以概念為基礎(chǔ),經(jīng)過嚴(yán)格規(guī)范化,通過概念組配方式表達文獻主題的規(guī)范化的詞或詞組。屬于人工語言,經(jīng)規(guī)范化處理。(由文獻加
19、工者提?。?如:電腦、微機(不規(guī)范詞)——計算機(規(guī)范詞)。受主題詞表(敘詞表)控制優(yōu)點:檢索結(jié)果準(zhǔn)確而全面缺點:需要查閱主題詞表常用INSPEC的詞表《INSPEC Thesaurus》、EI的《EI Thesaurus》及我國編輯出版的《漢語主題詞表》等。,主題詞語言,從文獻的題名和內(nèi)容中抽取出來的,能夠表達主題內(nèi)容的具有檢索意義的關(guān)鍵性詞匯。 屬于自然語言,未經(jīng)過規(guī)范處理。(由文獻作者提取) 沒有固定詞表
20、,標(biāo)引文獻時根據(jù)文獻內(nèi)容選擇恰當(dāng)?shù)脑~匯進行組配,以表達文獻的內(nèi)容特征。 優(yōu)點: 一是有利于計算機自動抽詞標(biāo)引,適合于電子信息資源的標(biāo)引和檢索?!《欠狭?xí)慣、容易接受。,3.4 關(guān)鍵詞語言,關(guān)鍵詞語言,缺點:查全率、準(zhǔn)確率較差。 同義詞標(biāo)引——引起漏檢;多義詞標(biāo)引——引起誤檢 例:同義詞,飛機: Airplane、Aircraft、Planes 多義詞, cell : 電池、細胞
21、,關(guān)鍵詞語言,主題詞是經(jīng)過人工規(guī)范的詞匯關(guān)鍵詞是沒有經(jīng)過規(guī)范的自然語言詞匯如:圖書館在標(biāo)引“土豆”、“洋芋”等方面的文獻時用“馬鈴薯”這一規(guī)范詞。 主顧、顧客、購物者、消費者、使用者、讀者等用“用戶”這一規(guī)范詞來表達。主題詞可以很好地避免漏檢,提高檢全率。,主題詞與關(guān)鍵詞的區(qū)別,分類法與主題法的區(qū)別,分類法以學(xué)科性質(zhì)類分文獻,它以學(xué)科集中文獻,屬于族性檢索,可能造成事物主題文獻的分散。主題法以主題詞概括文獻內(nèi)容,以事物主
22、題集中文獻,屬于特性檢索, 它可能造成學(xué)科文獻的分散。 例如:《地下工程系統(tǒng)分析與設(shè)計》這本書進行標(biāo)引 分類標(biāo)引:考慮本文主題內(nèi)容所屬學(xué)科及隸屬關(guān)系:“工業(yè)技術(shù)—建筑科學(xué)—地下建筑”,相應(yīng)分類號TU92。 主題標(biāo)引:不需考慮其所屬學(xué)科專業(yè),直接用描述內(nèi)容主題詞“地下工程“、”系統(tǒng)分析”標(biāo)引即可。,第四節(jié) 計算機檢索技術(shù),一、計算機檢索系統(tǒng)二、檢索提問式三、計算機檢索步驟,依檢索手段,信息檢索分為:手工檢索
23、:使用印刷型(書本式)的檢索工具 計算機檢索:運用計算機技術(shù)、網(wǎng)絡(luò)通信技術(shù),通過數(shù)據(jù)庫系統(tǒng)實現(xiàn)檢索。,4.1 計算機檢索系統(tǒng),4.1.1 發(fā)展歷程脫機批處理信息檢索聯(lián)機檢索系統(tǒng) 光盤檢索系統(tǒng)Internet網(wǎng)絡(luò)檢索,脫機批處理檢索階段(50年代中期至60年代中后期)1954年,美國海軍武器實驗站圖書館在一臺電子管計算機上建立了世界上第一個計算機檢索系統(tǒng)。20世紀(jì)50年代末,IBM公司利用一臺IBM650計算機成功地編制出關(guān)
24、鍵詞索引,并建立了世界上第一個“定題情報檢索”系統(tǒng)。利用單臺計算機進行檢索。過程:檢索機構(gòu)把多個用戶的檢索提問匯總到一起,進行批量檢索,然后把檢索結(jié)果通知各個用戶。特點:委托專業(yè)人員批量檢索,用戶不能在檢索過程中與主機進行“對話”和瀏覽文獻,不能及時修改檢索策略,不能及時獲得檢索結(jié)果。,發(fā)展歷程,聯(lián)機檢索階段(60年代中后期——80年代)20世紀(jì)60年代末,數(shù)據(jù)通訊網(wǎng)絡(luò)出現(xiàn),大容量計算機分時操作系統(tǒng)和強功能檢索軟件研制成功,使脫
25、機檢索發(fā)展到聯(lián)機檢索并迅速得到了推廣。終端/主機結(jié)構(gòu),由聯(lián)機檢索中心、通訊網(wǎng)、檢索終端等三部分組成。特點: (1) 無需委托。檢索過程是“人—機對話”式,用戶直接檢索,及時修改檢索策略。 (2) 檢索指令復(fù)雜,多為專業(yè)檢索人員才能熟練使用。 (3) 只對授權(quán)用戶開放。按時計費,檢索費用昂貴。,發(fā)展歷程,光盤檢索階段(80年代中期開始)1985年出現(xiàn)CD-ROM數(shù)據(jù)庫,利用計算機設(shè)備對只讀式光盤數(shù)據(jù)庫進
26、行檢索。單機光盤檢索系統(tǒng):提供單用戶、單機的使用,系統(tǒng)結(jié)構(gòu)簡單,但數(shù)據(jù)量少。光盤網(wǎng)絡(luò)系統(tǒng) :將光盤放在光盤塔或光盤庫中,由服務(wù)器管理運行。一般只提供在局域網(wǎng)上檢索,如圖書館網(wǎng)、校園網(wǎng)等,網(wǎng)上用戶可以分時共享光盤數(shù)據(jù)庫的資源。特點: (1) 系統(tǒng)配置簡單,實行菜單檢索,系統(tǒng)操作簡單。 (2) 光盤數(shù)據(jù)庫具有容量小的局限性、數(shù)據(jù)更新慢。,發(fā)展歷程,Internet網(wǎng)絡(luò)檢索階段(從90年代開始)隨著互聯(lián)網(wǎng)的迅速發(fā)展及超
27、文本技術(shù)的出現(xiàn),基于B/S(瀏覽器/服務(wù)器)的檢索軟件的開發(fā),將原來的主機系統(tǒng)轉(zhuǎn)移到Web服務(wù)器上,使B/S(瀏覽器/服務(wù)器)聯(lián)機檢索模式開始取代以往的終端/主機結(jié)構(gòu)。特點: (1)實現(xiàn)了任何時間、任何地點的檢索。 (2)操作簡單,適合大眾檢索。,發(fā)展歷程,DIALOG國際聯(lián)機檢索系統(tǒng),簡介 是目前世界上最大的國際聯(lián)機情報檢索系統(tǒng),覆蓋各行業(yè)的900多個數(shù)據(jù)庫。內(nèi)容涉及自然科學(xué)、社會科學(xué)、工程技術(shù)、人文科學(xué)、時事
28、報道及商業(yè)經(jīng)濟等各個領(lǐng)域。是全球最大的專業(yè)信息供應(yīng)商。功能 利用DIALOG系統(tǒng),可進行項目查新、文獻調(diào)研、課題立項、申報專利、了解市場動態(tài)和競爭對手、新產(chǎn)品開發(fā)、公司的背景情況、經(jīng)濟預(yù)測等等信息。,OCLC國際聯(lián)機檢索系統(tǒng),OCLC,即聯(lián)機計算機圖書館中心,創(chuàng)立于1967年,是一個不以盈利為目的、提供圖書館服務(wù)的會員制研究組織。 1991年,OCLC推出FirstSearch數(shù)據(jù)庫,把原有的聯(lián)機檢索服務(wù)擴展為綜合的、基于We
29、b的聯(lián)機參考服務(wù)系統(tǒng),目前發(fā)展成為全世界使用量最大的交互式聯(lián)機檢索系統(tǒng)。面向最終用戶,界面直觀、操作簡單、提供多種語言界面、多種輔助檢索工具,方便非專業(yè)檢索人員使用。當(dāng)前利用FirstSearch可以檢索到86個數(shù)據(jù)庫,內(nèi)容覆蓋15個主題范疇的各個學(xué)科領(lǐng)域。,http://www.oclc.org/asiapacific/zhcn/default.htm,4.1.2 數(shù)據(jù)庫(1) 概念數(shù)據(jù)庫:指長期存儲在計算機存儲設(shè)備上的、可
30、供計算機快速檢索的、有組織的、可共享的數(shù)據(jù)集合。本課程所指數(shù)據(jù)庫是指包含文獻信息有關(guān)數(shù)據(jù)的機讀記錄的有序集合。計算機檢索系統(tǒng)數(shù)據(jù)庫:一定專業(yè)范圍內(nèi)信息記錄及其索引的集合體。,(2) 數(shù)據(jù)庫結(jié)構(gòu),由字段——記錄——文檔三個層次構(gòu)成,字段(Fields):組成記錄的數(shù)據(jù)項(檢索項),一個字段代表一項特征。,,,,計算機檢索就是通過字段檢索,查找滿足條件的記錄。,,記錄(Record):數(shù)據(jù)庫的基本信息單元,每條記錄都描述了原始信息的各項
31、外表特征和內(nèi)容特征。,,計算機檢索的目的就是查找符合條件的記錄。,,,,,,,,,文檔,記錄,字段,文檔(File) :是機讀記錄的有序集合,由記錄及其索引組成。,,,,,,各文檔的集合,數(shù)據(jù)庫(Database):是文檔的集合。,綜合性數(shù)據(jù)庫:多按學(xué)科劃分文檔,(3) 數(shù)據(jù)庫的記錄格式,數(shù)據(jù)庫,存取號字段基本索引字段 篇名字段(TI)---Title 文摘字段(AB)---Abstract
32、 關(guān)鍵詞字段(KY)---Keyword 敘詞字段(DE)---Descriptor 自由詞字段(ID)---Identifier——全文檢索輔助索引字段 著者字段 (AU)--- Author 期刊名稱字段 (JN) ---Journal 語種字段(LA)---Language,4.2 檢索提問式,采用計算機信息檢索系統(tǒng)
33、規(guī)定使用的組配符號(也稱為算符)將反映不同檢索途徑的檢索單元組合在一起而形成的一種邏輯運算表達式?!?、布爾邏輯運算符 2、位置運算符 3、精確檢索符 4、限制符號(截詞符),舉例:查“計算機”方面的文章 計算機 or 電腦 or 微機 計算機 + 電腦 + 微機,檢索提問式,4.2.1 布爾邏輯算符 把一些具有簡單概念的檢索詞通過布爾邏輯算符組配成為一個具有復(fù)雜概念的檢索式,用
34、來準(zhǔn)確表達檢索提問。 (1) 邏輯“或”:并列概念關(guān)系的一種組配,通常用 or 或 + 表示,有助于擴大檢索范圍,提高查全率,防止漏檢?!∪纾篈 or B 、 A + B 表示它所連接的兩個檢索詞(A、B)中有任何一個出現(xiàn)在檢索結(jié)果中就滿足檢索條件。,舉例:查“分布式網(wǎng)絡(luò)系統(tǒng)”方面的文章 分布式 and 網(wǎng)絡(luò)系統(tǒng) 分布式 * 網(wǎng)絡(luò)系統(tǒng),檢索提問式,(2) 邏輯“與”:交叉概念關(guān)系和限
35、定關(guān)系的一種組配。通常用 and 或 * 表示,可以縮小檢索范圍,提高查準(zhǔn)率,防止誤檢。 如:A and B 、 A * B 表示它所連接的兩個檢索詞(A、B)必須同時出現(xiàn)在檢索結(jié)果中才滿足檢索條件。,舉例:查不含公路運輸?shù)慕煌ㄟ\輸方面的文章 交通運輸 not 公路 交通運輸-公路,檢索提問式,(3) 邏輯“非”:不包含某種概念關(guān)系的一種組配。通常用not或 - 表示?!∪纾篈 not B
36、 、 A - B 表示它所連接的兩個檢索詞中,應(yīng)從第一個概念中排除第二個概念。,檢索提問式,(4) 優(yōu)先算符:( ) 可以改變布爾邏輯的正常運算次序。 布爾邏輯運算次序為: 非(not)——與(and)——或(or) 例如: 大學(xué)生 or 研究生 not 就業(yè) (大學(xué)生 or 研究生) not 就業(yè) 兩者檢索結(jié)果不同。,檢
37、索提問式,4.2.2 位置運算符 限定“位置算符”兩邊的檢索詞出現(xiàn)在記錄中的位置?!。?)(W)算符With:要求檢索詞必須按指定順序緊密相連,詞序不可變,詞之間除允許有空格、標(biāo)點、連字符外,不得夾單詞或字母?!。╪W):表示連接的兩個詞之間最多可加入n個詞,詞序不可顛倒。,例如:building (W) construction :可檢出: “building construction”
38、 “building-construction” 又如:air(2W)Pollution :可檢出: “air pollution” “air environment pollution” “air and noise pollution”,檢索提問式,檢索提問式,(2) (N)算符Near:要求被連接的檢索詞必須緊密相連,詞序任意,詞之間
39、除允許有空格、標(biāo)點、連字符外,不得夾單詞或字母。 (nN)表示兩個檢索詞之間最多可加入N個詞,詞序任意。,例如: internet(N)accessing 可以檢出 “internet accessing”互聯(lián)網(wǎng)接入 “accessing internet”訪問因特網(wǎng)又如: environment(2N)protection,可檢出: “environment protec
40、tion” “environment resource protection” “protection of environment” “protection of water environment”,檢索提問式,(3) F算符(Field) 表示兩個檢索詞必須同時出現(xiàn)在同一個字段內(nèi),兩詞的詞序和中間插入的詞數(shù)不限。 例如: pollution(F)control/T
41、i 表示檢索同一字段中含有pollution 和control的文獻。如題名字段、文摘字段、關(guān)鍵詞字段,檢索提問式,(4) Same算符 檢索詞必須出現(xiàn)在同一句子中(指兩個句號之間的字符串),檢索詞在句子中的順序和位置是任意的?!±纾?education Same school 表示檢索某一句子中education 和 school 的文獻。,使用位置算符要注意的問題:主要應(yīng)用于英文數(shù)據(jù)庫多數(shù)用于數(shù)據(jù)庫的專業(yè)檢索方式(需
42、輸入檢索指令的檢索)不同的數(shù)據(jù)庫用到的位置算符不一樣,使用前查看檢索提 示或相關(guān)幫助,檢索提問式,4.2.3 精確(exact)檢索: 兩個或多個詞不能拆開,不能互換位置,中間不能插入任何字符?!√崾荆翰煌臄?shù)據(jù)庫對精確檢索的規(guī)定不一樣?!∮械氖褂谩?”、{ },如EI:“intelligent control” 有的使用空格,如IEE/IEEE:凵intelligent control凵; 還有一些數(shù)據(jù)庫通過特定程序控
43、制。,檢索提問式,4.2.4 截詞符 是指用給定的詞干做檢索詞,查找含有該詞干的全部檢索詞的記錄?!?” ,或 “?”,防止漏檢,提高查全率?!。?) 無限制截詞 “ * ” 一般用于詞尾,即“ 詞干* ”,——后截斷,表示詞干后面的字符位數(shù)不受限制?!∪?economic*,可檢索: economic 、economics、economicst、economicalism , … ?!∫灿杏糜谠~中間的, ——中間截斷,如su
44、l*ur,可檢索:sulfur、sulphur , … 也有用于詞前的, ——前截斷,如*magnetic,可檢索:magnetic, electro-magnetic, electromagnetic, …,檢索提問式,(2) 有限制截詞“ ? ” 在詞尾、詞中加有限個 “?”號?!個“?”號表示添加的字符數(shù)少于等于n個?!∪纾簊mok??,可檢索:smoke, smoky, smoker, … wom?n ,可檢索:
45、woman, women。,檢索提問式,檢索實例,1、工程造價 and(控制 or 管理) 2、TI= 青藏鐵路 * AU=朱永權(quán) * AF=(石家莊鐵道大學(xué) or 石家莊鐵道學(xué)院),檢索提問式,4.3 計算機檢索步驟,71,1、課題分析:明確檢索需求、確定查找范圍,檢索目的:大致分為三種類型普查型 —— 需要全面收集有關(guān)某一主題的文獻資料,強調(diào)“查全率”。如查新攻關(guān)型 —— 需要收集某一特定方面的文獻資料,旨在解決科研生產(chǎn)中的
46、關(guān)鍵問題。探索型 —— 了解和掌握某一領(lǐng)域的研究現(xiàn)狀,最新研究動向和研究成果,要求查到的文章具有新穎和及時的特點。查找范圍:主題、學(xué)科范圍,文獻類型,年限,語種,計算機檢索步驟,2、選擇數(shù)據(jù)庫,書目數(shù)據(jù)庫,文摘數(shù)據(jù)庫,數(shù)據(jù)、事實數(shù)據(jù)庫,WWW,……,全文數(shù)據(jù)庫,計算機檢索步驟,3、確定檢索詞及檢索途徑,(1)確定檢索詞: 將所有和主題相關(guān)的關(guān)鍵詞和短語標(biāo)出來。如可能,查主題詞表,利用規(guī)范的檢索詞。 刪除沒有檢索意義的詞、
47、存在蘊含關(guān)系可合并的詞 例如:研究、探討、討論、系統(tǒng)(2)選擇檢索途徑:主題詞、題名、關(guān)鍵詞、作者等,計算機檢索步驟,4、構(gòu)造檢索式,注意:在構(gòu)造檢索表達式之前一定弄清所用數(shù)據(jù)庫的檢索功能和支持的操作算符。,用布爾邏輯符、截詞符、位置符、精確符等連接檢索詞,來表達檢索詞之間的邏輯關(guān)系。,5、實施檢索,6、修改檢索策略,檢索結(jié)果過多——縮小檢索范圍檢索結(jié)果過少——擴大檢索范圍檢索結(jié)果相關(guān)度小——修改檢索詞、檢索式,更換檢索工具
48、,7、獲取原文,a. 館藏目錄、文摘數(shù)據(jù)庫——查找原始出版物,如圖書、期刊、學(xué)位論文等b. 全文數(shù)據(jù)庫——直接下載原文c. 文獻傳遞——通過圖書館的原文傳遞服務(wù)d. 其他方式,計算機檢索步驟,第1步:標(biāo)出和主題相關(guān)的關(guān)鍵詞 神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機械故障診斷中的應(yīng)用研究第2步:刪除不必要的檢索詞 刪除“應(yīng)用”和“研究第3步:對核心詞進行補充和擴展 神經(jīng)網(wǎng)絡(luò)——人工智能(上位詞) 故障診斷——故障定
49、位、故障檢測第4步:選擇檢索途徑 題名、關(guān)鍵詞、主題詞等。第5步:構(gòu)造檢索式(檢索詞之間的關(guān)系)DE=(神經(jīng)網(wǎng)絡(luò) or 人工智能) and TI=旋轉(zhuǎn)機械 and KY=(故障診斷 or 故障定位 or 故障檢測),課題:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機械故障診斷中的應(yīng)用研究,,,,,,,,,,,計算機檢索步驟,—以主題檢索為例,—以關(guān)鍵詞檢索為例,旋轉(zhuǎn)機械—以題名檢索為例,舉例:我國城市軌道交通經(jīng)營模式研究,(1)分析課題,明確目的(2)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- [學(xué)習(xí)]網(wǎng)絡(luò)信息檢索基礎(chǔ)知識
- 第二節(jié)激勵理論基礎(chǔ)
- 第二節(jié) 資產(chǎn)的計稅基礎(chǔ)
- 第二節(jié)溫度的測量[知識梳理]
- 第二節(jié)
- 第二節(jié):激勵理論基礎(chǔ).doc
- 第二節(jié) 核能
- 第二節(jié)疼痛
- 第二節(jié)陶淵明
- 第二節(jié) 貧血
- 第二節(jié)物理
- 第二節(jié)功率
- 第二節(jié)功率
- 第二節(jié)血管
- 閱讀第二節(jié)
- 第二節(jié) 質(zhì)量
- 音樂基礎(chǔ)與欣賞——第二節(jié)記譜法
- 第二節(jié) 地球的運動
- 第二節(jié) 運動的描述
- 第二節(jié)臂.dwg
評論
0/150
提交評論