版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、,2013.9閆 雷,醫(yī)學(xué)文獻(xiàn)檢索,為什么要學(xué)習(xí)文獻(xiàn)檢索?,科學(xué)研究的一般工作流程:,檢索相關(guān)的研究 分析現(xiàn)有的研究結(jié)果 發(fā)現(xiàn)問題 提出假說,制訂試驗方案 定義試驗步驟 試驗 數(shù)據(jù)匯總,數(shù)據(jù)可視化 數(shù)據(jù)驗證 調(diào)整試驗 重新校驗假說,寫作研究論文 發(fā)表研究論文,研究活動:反復(fù)、重復(fù)、動態(tài)、以人為中心依賴于各種不同的資源,為什么要學(xué)習(xí)文獻(xiàn)檢索?,據(jù)美國科學(xué)基金會統(tǒng)計,一個科研人員花費在查找和消化科技資料上的時
2、間需占全部科研時間的51%,計劃思考占8%,實驗研究占32%,書面總結(jié)占9%。由上述統(tǒng)計數(shù)字可以看出,科研人員花費在科技出版物上的時間為全部科研時間的60%。,基礎(chǔ)知識,一.文獻(xiàn)及其類型 1.文獻(xiàn)(documents,literature):是記錄有知識的一切載體。 四要素: (1)記錄知識的具體內(nèi)容 (2)記錄知識的手段,如文字、圖像、符號、聲頻、視頻等
3、 (3)記錄知識的物質(zhì)載體,如紙張、光盤、錄像帶等 (4)記錄知識的表現(xiàn)形態(tài),如圖書、期刊、專利說明書等,基礎(chǔ)知識,2.文獻(xiàn)的類型:(按載體類型、出版形式、內(nèi)容加工深度、獲取難易程度等進行分類) A.文獻(xiàn)按內(nèi)容加工深度可分四類: (1)一次文獻(xiàn)(Primary Document):指作者以其本人的研究成果(如實驗、觀察、調(diào)查研究等結(jié)果)為基本素材寫成的原始創(chuàng)作。 所記錄的是
4、作者的最新發(fā)現(xiàn)或發(fā)明,以及新的見解、新的理論、新的方法等新穎、具體而詳盡的知識,因而成為科學(xué)研究等工作的最主要信息來源,尤其是期刊論文,已成為科技文獻(xiàn)的主體,但由于其量大、分散而無序,給讀者的查找和利用帶來了極大的不便。 (2)二次文獻(xiàn)(Secondary Document):即檢索工具,是指將大量無序、分散的一次文獻(xiàn)收集、整理、加工、著錄其特征如著者、篇名、分類、主題、出處等,并按一定的順序加以編排,形成供讀者檢索所需一次文獻(xiàn)線索
5、的新的文獻(xiàn)形式。包括索引、文摘、目錄及相應(yīng)的數(shù)據(jù)庫。,基礎(chǔ)知識,(3)三次文獻(xiàn)(Tertiary Document):科技人員圍繞某一主題,利用二次文獻(xiàn)的檢索,在吸取一次文獻(xiàn)內(nèi)容的基礎(chǔ)上,即經(jīng)過閱讀、分析、歸納、概括,撰寫而成的新的文獻(xiàn),或綜述已取得的成果進展,或加評論、或預(yù)測發(fā)展趨勢。形如綜述(review)、述評(comment)、進展(advance; progress)、現(xiàn)狀(update)、發(fā)展趨勢(trend)等期刊文獻(xiàn)和百
6、科全書、年鑒、手冊等參考工具書。 (4)零次文獻(xiàn)(Zero Document):指未經(jīng)信息加工,直接記錄在載體上的原始信息,如實驗數(shù)據(jù)、觀測記錄、調(diào)查材料等。,,研究活動(實驗、觀察、思考),,,,,,,,,信息的直接記錄或傳遞,零次文獻(xiàn)(創(chuàng)造知識的素材),將知識以文字等形式固化,一次文獻(xiàn)(初始的知識產(chǎn)品),將分散的文獻(xiàn)序列化,二次文獻(xiàn)(一次文獻(xiàn)的替代品),將知識重新組合,使知識序列化,三次文獻(xiàn)(濃縮的新的信息產(chǎn)品),各級文獻(xiàn)的形成
7、及相互關(guān)系,基礎(chǔ)知識,B.文獻(xiàn)按獲取的難易程度可分三類: (1) 白色文獻(xiàn):完全公開 (2) 黑色文獻(xiàn):完全不公開 (3)灰色文獻(xiàn): 內(nèi)部交流,基礎(chǔ)知識,3.文獻(xiàn)信息的特點(1)數(shù)量龐大,增長迅速(2)文種繁多,但呈明顯的英文化趨勢(3)內(nèi)容交叉重復(fù)(4)文獻(xiàn)形式呈現(xiàn)多樣化(5)文獻(xiàn)分布既集中又分散,但呈專題化或?qū)<厔荩?)知識老化加快,文獻(xiàn)壽命(半衰期)縮短 (7)交流傳播及變化速度加快,基
8、礎(chǔ)知識,4.文獻(xiàn)信息的社會功能(作用)?。?)是科學(xué)的表現(xiàn)形式,是匯集人類財富的主要場所 (2)是衡量科學(xué)技術(shù)水平的重要依據(jù)?。?)是傳播科學(xué)知識的最基本、最主要的手段?。?)是確認(rèn)科學(xué)發(fā)現(xiàn)與技術(shù)發(fā)明優(yōu)先權(quán)的認(rèn)證記錄,基礎(chǔ)知識,5.醫(yī)學(xué)文獻(xiàn)的結(jié)構(gòu) ?。?)圖書的結(jié)構(gòu):主要包括封面、封底、書脊、書名頁、出版說明、前言(序)、目次、附錄、后記等。 參考文獻(xiàn)的格式(NLM采用的ANSI標(biāo)準(zhǔn)格式) Norman IJ, Red
9、fern SJ,editors. Mental health care for elderly people. New York: Churchill Livingstone ;1996,基礎(chǔ)知識,書中的章節(jié): Philips SJ, Whisnant JP. Hypertension and stroke. In: Laragh JH, Brenner BM, editors. Hypertension: pathophysi
10、ology, diagnosis, and management. 2nd ed. New York: Raven Press; 1995.p.465-78.,基礎(chǔ)知識,(2)期刊論文結(jié)構(gòu): 期刊論文包括文章題目、作者、摘要、關(guān)鍵詞、(分類號)、正文、參考文獻(xiàn)?!⒖嘉墨I(xiàn)格式: 1) Vega KJ, Pina I, Krevsky B. Heart transplantation is associated with
11、an increased risk for pancreatobiliary disease. Am Intern Med 1996 Jun 1;124(11):980-3,基礎(chǔ)知識,2) Semin Oncol 1996;23(1 Suppl 2):80-97 3) Clin Orthop 1995;(320):110-4,基礎(chǔ)知識,6. 參考工具書的類型與使用 參考工具書(reference books, referen
12、ce tools) 是匯集某一學(xué)科范圍的知識信息,按照一定的體例和檢索方法編排而成的專供查考資料或資料線索的特種圖書。 類型:詞典、百科全書、年鑒、手冊、名錄、醫(yī)學(xué)圖譜、藥典等。,基礎(chǔ)知識,參考工具書特點: 查考性:參考工具書編寫的目的是綜合某一方面的知識,供人們查詢考證解決特定問題;而普通圖書提供比較系統(tǒng)的知識和觀點、供人們系統(tǒng)學(xué)習(xí)和閱讀。 概括性:參考工具書內(nèi)容取材廣泛,提供的信息完整翔實又高度概括,具有一定
13、的權(quán)威性;而普通圖書圍繞某一特定問題或?qū)W科做深入、系統(tǒng)地闡述,內(nèi)容比較連貫完整。 易檢性:參考工具書在編制上具有嚴(yán)謹(jǐn)?shù)慕Y(jié)構(gòu)、詳細(xì)的體例和多種檢索途徑,便于迅速查找;而普通圖書一般按照學(xué)科或問題本身系統(tǒng)分章節(jié)敘述。,基礎(chǔ)知識,二.檢索語言 檢索語言是用于描述信息系統(tǒng)中信息的內(nèi)容特征或外表特征和表達(dá)用戶信息提問的專門語言,是人與信息系統(tǒng)對話的媒介。在各種信息檢索系統(tǒng)中,信息都必須被標(biāo)引或賦予某種簡潔的,大多數(shù)還具有唯一性、科學(xué)性、實用
14、性及一定權(quán)威性和標(biāo)準(zhǔn)化的標(biāo)識或編碼,即便于計算機處理,又有利于信息的廣泛交流與共享。,檢索語言,檢索語言主要包括:文獻(xiàn)外表特征檢索語言和文獻(xiàn)內(nèi)容特征檢索語言。 前者是以文獻(xiàn)的外表特征作為標(biāo)識和檢索點而設(shè)計的檢索語言,主要應(yīng)用有:文獻(xiàn)題名索引系統(tǒng)、著者索引系統(tǒng)、文獻(xiàn)序號索引系統(tǒng)和引文索引系統(tǒng) 后者是以文獻(xiàn)的內(nèi)容特征作為標(biāo)識和檢索點而設(shè)計的檢索語言,主要有分類檢索語言和主題描述語言兩大類。,分類檢索語言,
15、分類檢索語言是將各種知識領(lǐng)域(學(xué)科及其研究問題)的類目按知識分類原理進行系統(tǒng)排列,以代表類目的分類號(如字母符號、數(shù)字等)作為文獻(xiàn)標(biāo)識的一類檢索語言。,分類檢索語言,文獻(xiàn)分類法是根據(jù)文獻(xiàn)所反映的學(xué)科知識內(nèi)容及其他特征,分門別類地、系統(tǒng)地揭示和組織文獻(xiàn)的一種方法。其主要目的是為了滿足人們按學(xué)科知識體系檢索文獻(xiàn)的要求。文獻(xiàn)分類法通常分為等級體系分類法(亦稱等級列舉式分類法或體系分類法)、分面組配分類法兩種基本類型,也有將兩者結(jié)合編制而成的
16、等級—組配分類法。其中以體系分類法最為常用,重點介紹《中國圖書館分類法》,中國圖書館分類法,《中國圖書館分類法》(簡稱《中圖法》)是我國各類圖書館應(yīng)用最廣泛的分類法,圖書館使用它進行館藏文獻(xiàn)的分類排架和編制分類目錄。同時《中圖法》在我國的圖書發(fā)行、數(shù)據(jù)庫的科學(xué)論文標(biāo)引、以及網(wǎng)絡(luò)信息資源組織與檢索等多個領(lǐng)域也有廣泛應(yīng)用。目前《中圖法》的最新版是2010年出版的第五版。,中國圖書館分類法,1. 層累標(biāo)記制 《中圖法》的分類號采用字母
17、與阿拉伯?dāng)?shù)字相結(jié)合的混合制編碼,用一個字母標(biāo)志一個大類,以字母的順序反映大類的序列,在字母后用數(shù)字表示大類下的類目的劃分。數(shù)字的編號制度,使用小數(shù)制,即首先順序字母后第一位數(shù)字,然后順序第二位,以下類推。數(shù)字的位置,基本上遵從層累制原則,即盡可能使號碼的位數(shù)代表類目的等級數(shù),當(dāng)一個分類號的數(shù)字超過三位時,為了醒目而加上小圓點“.”,并無其他意義。,中國圖書館分類法,類目按概念間的邏輯隸屬關(guān)系,由上至下逐級展開,劃分出更專指、更具體的類目
18、。如“R323.123 靜脈”的上下級類目從上至下依次是:,,中國圖書館分類法,2.復(fù)分號 復(fù)分是增強類目的細(xì)分化程度,提高類目專指度的分類措施,是圖書館分類法的重要組成部分?!吨袌D法》的復(fù)分表主要有通用復(fù)分表和專類復(fù)分表兩種,這些復(fù)分表的號碼不能單獨使用,只能加在主分類號后面作為共性區(qū)分的標(biāo)識?!吨袌D法》通用復(fù)分表有8個,如總論、地理、時代、民族復(fù)分表。,中國圖書館分類法,總論復(fù)分表中的描述圖書的外部特征如教材、工具書等
19、的復(fù)分號及其含義舉例如下表: 圖書分類號舉例: R28 《中藥學(xué)》 R28-61《中藥學(xué)辭典》 R28-64 《中藥學(xué)圖譜》,中國圖書館分類法,專類復(fù)分表專供某些類目的進一步細(xì)分之用。例如,專供R5-R8(臨床醫(yī)學(xué)各類)的復(fù)分表如上:例如: R581 甲狀腺疾病 R512.6 病毒性肝炎 R581.04 甲狀腺疾病診斷
20、 R512.603 病毒性肝炎免疫學(xué),中國圖書館分類法,3. 基本大類(22個),中國圖書館分類法,4. R 醫(yī)藥、衛(wèi)生 大類下設(shè)17個二級類目,主題描述語言,主題描述語言是用于表達(dá)文獻(xiàn)主題內(nèi)容的詞語標(biāo)識系統(tǒng),應(yīng)用較多的是主題詞法和關(guān)鍵詞法。1. 主題詞法:主題詞(Subject Headings)又稱敘詞(Dscriptor),其主要特點是:(1)采用指定的詞語――“主題詞”,來專指或網(wǎng)羅相應(yīng)的概念,也就是適當(dāng)歸并某個概念的
21、同義詞、近義詞、拼法變異詞及縮寫等,以保證這個“主題詞”與這個概念唯一對應(yīng);(2)采用參照系統(tǒng)將某些非主題詞指向主題詞或者顯示相關(guān)主題詞間的詞義相關(guān)關(guān)系;(3)采用類似分類的方法編制主題詞分類索引(范疇表)和等級索引(樹狀結(jié)構(gòu)),采用類似關(guān)鍵詞法編制主題詞(詞素)輪排索引,以從多方面顯示詞間關(guān)系并便于查找主題詞;(4)以上內(nèi)容和規(guī)則構(gòu)成一部主題詞表,其中的主題詞還隨著科學(xué)的發(fā)展及文獻(xiàn)中用詞的變化而不斷有增刪修訂定期更新。,主題描述
22、語言,2. 關(guān)鍵詞法:關(guān)鍵詞法是為適應(yīng)計算機自動編制索引的需要而產(chǎn)生的。所謂關(guān)鍵詞(Key-word)是指出現(xiàn)在文獻(xiàn)或網(wǎng)頁的標(biāo)題(篇名、章節(jié)名)或文摘、全文中,能表達(dá)文獻(xiàn)實質(zhì)內(nèi)容的,并且能被人們作為檢索入口的關(guān)鍵性名詞術(shù)語。 關(guān)鍵詞法的最大優(yōu)點是由于語詞直接采用出現(xiàn)在最新文獻(xiàn)或網(wǎng)頁中的專業(yè)自然語言,一些在科學(xué)發(fā)展中最新出現(xiàn)的專業(yè)名詞術(shù)語能及時進入索引系統(tǒng);同時計算機編制關(guān)鍵詞索引還具有成本低、速度快、時差短等優(yōu)點。
23、 但關(guān)鍵詞法也有很多缺點:(1)同一概念存在同義詞、近義詞、拼法變異詞等,容易造成漏檢;(2)若平均每篇文獻(xiàn)標(biāo)引的關(guān)鍵詞較多,雖然減少漏檢,但是誤檢增加;(3)關(guān)鍵詞法不對文獻(xiàn)的實質(zhì)主題內(nèi)容進行分析,關(guān)鍵詞難以準(zhǔn)確揭示文獻(xiàn)實質(zhì)內(nèi)容,檢索的準(zhǔn)確性較差。,醫(yī)學(xué)主題詞表,《醫(yī)學(xué)主題詞表》(Medical Subject Headings,簡稱MeSH表),美國國立醫(yī)學(xué)圖書館(NLM)研制的用于標(biāo)引、編目和檢索生物醫(yī)學(xué)文獻(xiàn)的英文受
24、控詞表。 MeSH表匯集了由著名的醫(yī)學(xué)專家、醫(yī)學(xué)編輯和醫(yī)學(xué)圖書館專家推薦的、在生物醫(yī)學(xué)領(lǐng)域里使用頻繁且使用者認(rèn)可的主題詞2.5萬多個,副主題詞83個。,,NLM提供4種方式聯(lián)機免費獲取其電子版及相關(guān)信息:一是MeSH Browser;二是UMLS Metathesaurus(超級敘詞表);三是MeSH網(wǎng)站(http://www.nlm.nih.gov/mesh);四是MeSH databases,應(yīng)用及獲取,概念體系,MeSH表
25、的概念體系是由主題詞、限定詞、補充概念和款目詞組成。1.主題詞(main headings) 主題詞又稱敘詞(Descriptors),是用于描述主題事物或內(nèi)容的規(guī)范化詞匯。,,(1)主題詞的形式:MeSH表的詞匯以名詞為主,可數(shù)名詞多采用復(fù)數(shù)形式,如Blood Cells;不可數(shù)名詞或表示抽象概念的名詞采用單數(shù)形式,如Brain Stem;主題詞可以是單個詞,也可以是詞組,詞組形式的主題詞一般按自然語序采用順置形,如Lung Ab
26、scess(肺膿腫)、Hepatic Coma(肝昏迷)等。,概念體系,概念體系,但是,為了使概念相近的族性主題詞集中在一起,有些復(fù)合主題詞采用倒置形式,將復(fù)合主題目詞中被修飾的名詞放在前面,起修飾限定的形容詞放在名詞之后,并用“,”分開。例如: Shock, Cardiogenic (心源性休克) Shock,Hemorrhagic (出血性休克) Shock,Septic
27、 (敗血性休克) 倒置后,凡有關(guān)休克的文獻(xiàn)都相應(yīng)集中在 “Shock”這個主題詞下,為檢索者提供了族性選 詞的方便。,概念體系,(2)主題詞的單一性:一個詞語只表達(dá)一個概念,一個概念只用一個詞語表達(dá),有利于提高文獻(xiàn)的查全率。(3)主題詞的動態(tài)性:MeSH表是醫(yī)學(xué)常用規(guī)范化詞匯的濃縮,必然隨著醫(yī)學(xué)科學(xué)的不斷發(fā)展而不斷的增刪、調(diào)整,以便及時反映醫(yī)學(xué)科學(xué)的最新發(fā)展、新主題和新事物,有一定的動態(tài)性。,概念體系,2.樹狀結(jié)
28、構(gòu)號:根據(jù)每個主題詞的詞義范疇和學(xué)科屬性,可將全部主題詞歸入16個大類(以大寫字母A-N,V,Z表示),每個大類又細(xì)分為100多個二級類目,二級類目再層層劃分,逐級展開,使同一概念范圍的主題詞成族展示它們之間的并列、隸屬等相互關(guān)系,每一個主題詞均給予一個相應(yīng)的樹狀結(jié)構(gòu)號,最多可達(dá)11級,形成主題詞的狀結(jié)構(gòu)體系,少數(shù)主題詞按其屬性須跨兩個或多個類,這樣的主題詞被同時給予多個樹狀結(jié)構(gòu)號。,概念體系,概念體系,,3.限定詞(qualifier
29、s)又稱副主題詞(subheadings),是對文獻(xiàn)主題起限定作用,構(gòu)成主題的一些通用性概念,本身無獨立檢索意義。限定詞的數(shù)量及其可組配的主題詞的范圍均有嚴(yán)格規(guī)定。到2009年,MeSH表規(guī)定使用的限定詞有83個,概念體系,,4.補充概念(supplement concept)補充概念又稱補充化學(xué)物質(zhì)名稱,用于標(biāo)引MEDLINE中出現(xiàn)的化學(xué)物質(zhì)和毒品等并在PubMed中可用化學(xué)物質(zhì)名稱字段[NM]進行檢索的概念。 目前MeSH表收錄
30、有455000多個補充概念。,概念體系,,5.款目詞(entry terms)款目詞又稱見參照(see references),是主題詞的同義詞或相關(guān)詞,作用是將自由詞引見到主題詞,概念體系,MeSH Browser,MeSH Browser(醫(yī)學(xué)主題詞瀏覽器,http://www.nlm.nih.gov/mesh/mbrowser.html)是MeSH表的網(wǎng)絡(luò)版,旨在幫助用戶迅速查詢相關(guān)主題詞并顯示主題詞的等級結(jié)構(gòu)體系。,,MeSH
31、 Browser提供了2種查詢方式:①輸詞查詢(Enter term or the beginning of any root fragments②樹形結(jié)構(gòu)導(dǎo)航查詢(Navigate from tree top),MeSH Browser檢索界面,,基礎(chǔ)知識,三.文獻(xiàn)檢索 1.定義:根據(jù)用戶需要,利用檢索工具和檢索系統(tǒng),查找出符合用戶特定需要文獻(xiàn)的過程?!?.方法:?。?)常用法(工具法):順查法,倒查法,抽查法?。?)追溯
32、法?。?)分段法?。?)瀏覽法,基礎(chǔ)知識,3.文獻(xiàn)檢索的意義和作用:?。?)獲取科學(xué)知識的最佳捷徑?。?)避免科研工作重復(fù)、少走彎路?!。?)提高科研、生產(chǎn)效率,節(jié)省時間?!。?)提高信息素養(yǎng)。,基礎(chǔ)知識,4.文獻(xiàn)信息檢索系統(tǒng) 定義:是指根據(jù)人類社會對知識信息的普遍性需要,由一定的硬件設(shè)備和軟件條件所構(gòu)成的,具有選擇、整理、加工、存儲和檢索文獻(xiàn)信息功能的有序化信息資源集合體。,基礎(chǔ)知識,文獻(xiàn)信息檢索系統(tǒng)的構(gòu)成
33、(1)文獻(xiàn)信息資源 (2)硬件設(shè)備 (3)軟件條件 (4)人力資源,基礎(chǔ)知識,文獻(xiàn)信息檢索系統(tǒng)的功能 (1)匯集文獻(xiàn)信息 (2)組織文獻(xiàn)信息 (3)檢索文獻(xiàn)信息,基礎(chǔ)知識,文獻(xiàn)信息數(shù)據(jù)庫的結(jié)構(gòu)(1)記錄(record):構(gòu)成文獻(xiàn)信息數(shù)據(jù)庫的基本單元,它揭示了文獻(xiàn)的內(nèi)容特征和外表特征。(2)字段(field):比記錄更小的單位,是組成記錄的基本單元,在數(shù)據(jù)庫檢索時,也是一個檢
34、索點或檢索入口。(3)文檔(document):兩重含義: 一是指數(shù)據(jù)庫中一部分記錄的集合 二是從數(shù)據(jù)庫的組成方式分:順排文檔(按記錄的順序號排列)、倒排文檔(按主題詞或作者排列),基礎(chǔ)知識,上述數(shù)據(jù)庫的結(jié)構(gòu),可用英文單詞的單復(fù)數(shù)形式更直觀地表述為 :,record Fields (記錄),database flies (數(shù)據(jù)庫),,,,,File
35、 Records (文檔),field searching entry (字段) ?。z索入口),基礎(chǔ)知識,數(shù)據(jù)庫的類型:按其收錄內(nèi)容和功能的不同可分為如下類型:(1)書目型數(shù)據(jù)庫(Bibliographic Database)(2)事實數(shù)值型數(shù)據(jù)庫(Fact-Data Database)(3)全文數(shù)據(jù)庫(Full-text Database)
36、,基礎(chǔ)知識,5.文獻(xiàn)信息檢索途徑: (1)主題詞檢索:推薦!《醫(yī)學(xué)主題詞表》MeSH (2)自由詞(文本詞)檢索:包括標(biāo)題詞、關(guān)鍵詞、文摘詞、全文詞,注意同義詞! (3)分類檢索:中國圖書館分類法(中圖法) (4)著者檢索:姓前用全稱,名后用首字,注意東西方人名書寫習(xí)慣。,基礎(chǔ)知識,(5)題名檢索途徑:(書名,刊名,篇名)(6)序號檢索:文獻(xiàn)特有序號(ISSN、ISBN、專利號、公開號、報告號、合同號、
37、化學(xué)物質(zhì)登記號等)(7)機構(gòu)檢索:文章發(fā)表時作者所任職的單位(8)引文檢索:被引文獻(xiàn)?引用文獻(xiàn)(9)缺省檢索:預(yù)先設(shè)定的多字段組合檢索 (10)其他途徑:分子式索引、生物體索引等,基礎(chǔ)知識,7.文獻(xiàn)檢索步驟:,,,,,,,文獻(xiàn)檢索技術(shù),布爾邏輯檢索技術(shù),最常用的方法;用戶的信息需求通過檢索提問式表達(dá);采用布爾代數(shù)中的邏輯符AND、OR和NOT作為邏輯組配算符;計算機根據(jù)表達(dá)式確定命中文獻(xiàn)的基本條件與查找途徑,同文檔中各篇文
38、獻(xiàn)的標(biāo)識進行匹配。凡符合條件的文獻(xiàn)即為命中文獻(xiàn),予以輸出。,布爾邏輯檢索技術(shù),布爾運算符AND、OR、NOT,分別表示邏輯與、邏輯或、邏輯非三種邏輯運算關(guān)系,如下圖所示。,,布爾邏輯運算示意圖,A AND B,A OR B,A NOT B,布爾邏輯檢索技術(shù),布爾邏輯運算一覽表,布爾邏輯檢索技術(shù),邏輯“與”,檢索表達(dá)式為 “A and B”。數(shù)據(jù)庫中同時含有檢索同A和B的文獻(xiàn)為命中文獻(xiàn);作用是縮小檢索范圍,提高查準(zhǔn)率;例如,查找
39、“胰島素治療糖尿病”的文獻(xiàn),檢索式為 insulin(胰島素) and diabetes(糖尿病)。,布爾邏輯檢索技術(shù),邏輯“或”,檢索表達(dá)式為“A or B”。數(shù)據(jù)庫中的文獻(xiàn)中含有檢索詞A或B的文獻(xiàn)為命中文獻(xiàn);作用是擴大檢索范圍;例如,查找“腫瘤”的文獻(xiàn),檢索式為cancer(癌) or tumor(瘤) or carcinoma(癌) or neoplasm (新生物)。,布爾邏輯檢索技術(shù),邏輯“非”,檢索表達(dá)式為“A not
40、 B”。數(shù)據(jù)庫中凡含有檢索詞A而不含B的文獻(xiàn)為命中文獻(xiàn);作用是縮小檢索范圍,提高查準(zhǔn)率;例如,查“動物的乙肝病毒(不要人的)”的文獻(xiàn),檢索式為 hepatitis B virus(乙肝病毒) not human(人類)。,布爾邏輯檢索技術(shù),布爾邏輯運算的優(yōu)先順序當(dāng)一個檢索表達(dá)式含有多個布爾算符時,執(zhí)行的順序為not優(yōu)先運算,and其次,or最后??捎脠A括號改變運算順序,將需要優(yōu)先運算者置于圓括號中。例如,查找“維生素C或維生
41、素E對糖尿病患者腎臟的保護作用”,檢索式為:(維生素C or 維生素E)and 糖尿病 and 腎。,截詞檢索,截詞檢索,利用截斷的詞的一個局部即截詞,進行檢索的技術(shù);自動地對同一概念檢索詞的不同詞尾變化、詞根相同等一類提問詞進行檢索,并自動用OR連接各詞的檢出結(jié)果,避免文獻(xiàn)的漏檢和逐詞鍵入的麻煩,提高查全率;常用的截詞符號有“ * ”、“ ?”。,,截詞檢索,分類按是否采用截詞符號分為,采用截詞符號、不用截詞符號;按截斷位置
42、的不同分為,右截詞、左截詞、中間截詞;按截斷的字符數(shù)量的不同分為,無限截詞、有限截詞。,鄰近檢索,鄰近檢索(proximity searching)是用來表示檢索詞與檢索詞之間位置關(guān)系的檢索技術(shù),通常用位置算符來實現(xiàn);采用的位置算符有near,with?!皀ear”,表示檢索詞位置相鄰,檢索詞出現(xiàn)的順序可前可后,如gene NEAR apoptosis;“with”,表示檢索詞位置相鄰,且兩詞出現(xiàn)的順序與輸入順序一致,如live
43、r WITH cancer。,限定檢索,限定檢索(limit Searching)又稱限定字段檢索(limit Field Searching),是利用檢索詞出現(xiàn)的字段進行的檢索;用戶可以指定檢索某一字段或某幾個字段以使檢索結(jié)果更為準(zhǔn)確,減少誤檢;檢索系統(tǒng)的限定檢索會采用縮寫形式的字段標(biāo)識符;如 TI表示Title,AD表示Address。,,,,,,,,,,,,擴展檢索,擴展檢索(expand searching)是同時對多個相
44、關(guān)檢索詞執(zhí)行邏輯或檢索的技術(shù);即當(dāng)用戶輸入一個檢索詞后,系統(tǒng)不僅能檢出該檢索詞的文獻(xiàn),還能檢出與該檢索詞同屬于一個概念的同義詞或下位詞的文獻(xiàn),如PubMed中主題詞的擴展檢索。,加權(quán)檢索,加權(quán)檢索(weighing searching)不僅檢索提問詞是否存在,而且計算提問詞的權(quán)值,當(dāng)權(quán)值之和超過閾值的記錄才能在數(shù)據(jù)庫中被檢出來。在某些數(shù)據(jù)庫中表現(xiàn)為僅檢索主要概念主題詞,如MEDLINE;而有些數(shù)據(jù)庫表現(xiàn)為詞頻檢索,如中國學(xué)術(shù)期刊
45、全文數(shù)據(jù)庫。,精確檢索和模糊檢索,精確檢索(exact searching)是指所檢信息與輸入的詞組完全一致的匹配檢索技術(shù);在許多系統(tǒng)中用引號來表示,如檢索“Acute Pancreatitis”;模糊檢索(fuzzy searching)允許所檢信息與檢索提問之間存在一定的差異。如檢索Acute Pancreatitis,可檢索出Acute necrotizing Pancreatitis、Acute gallstone Pan
46、creatitis等。,跨庫檢索,跨庫檢索(cross database searching、One-stop searching)是一次對多個數(shù)據(jù)庫同時進行檢索的技術(shù)??鐜鞕z索能為用戶提供統(tǒng)一的檢索接口,將用戶檢索需求轉(zhuǎn)化為不同數(shù)據(jù)庫的檢索表達(dá)式,并發(fā)地檢索本地和廣域網(wǎng)上的多個分布式異構(gòu)數(shù)據(jù)庫,并對檢索結(jié)果加以整合,以統(tǒng)一的格式將結(jié)果呈現(xiàn)給用戶。,跨庫檢索,,相關(guān)信息反饋檢索,相關(guān)信息反饋檢索,是將與已檢結(jié)果存在某種程度相關(guān)的信息檢
47、索出來的檢索技術(shù),多由檢索系統(tǒng)自動進行檢索。如Google(http://www.google.com)的“類似網(wǎng)頁”、PubMed的“Related Articles”。,相關(guān)信息反饋檢索,,,,智能檢索,自動實現(xiàn)檢索詞、檢索詞對應(yīng)主題詞及該主題詞所含下位詞的同步檢索。如中國生物醫(yī)學(xué)文獻(xiàn)服務(wù)系統(tǒng)(SinoMed)的智能檢索。PubMed的“自動詞語匹配檢索”屬于智能檢索。,檢索策略的調(diào)整,(1)擴大檢索范圍的方法:
48、 增加同義詞或近義詞,用OR組配; 主題詞擴展檢索(有下位詞)或使用上位主題詞進行檢索; 檢索相關(guān)主題詞; 使用截詞符或通配符; 減少檢索的字段限定; 橫向檢索; 檢索引文。,基礎(chǔ)知識,(2)縮小檢索范圍的方法: 使用邏輯運算符“and”或“not”; 選擇專指性的檢索詞; 使用
49、副主題詞; 主題詞加權(quán)檢索; 限制字段檢索。,基礎(chǔ)知識,10.檢索策略的制定 制定檢索策略時要注意以下幾點: (1)盡可能采用主題詞檢索; (2)為保證檢出切題文獻(xiàn),可使用自由詞檢索; (3)注意用好邏輯組配關(guān)系; (4)如果檢出的同類文獻(xiàn)過多,使用縮小檢索范圍的方法; (5)如果檢出的同類文獻(xiàn)過少,使用擴大檢索范圍的方法。,基礎(chǔ)知識,11.檢索效果的評價 查全率(recall):指系
50、統(tǒng)在進行某一檢索時,檢出的相關(guān)文獻(xiàn)量占系統(tǒng)文獻(xiàn)庫中相關(guān)文獻(xiàn)量的比率,它反映該系統(tǒng)文獻(xiàn)庫中實有的相關(guān)文獻(xiàn)量在多大程度上被檢索出來。 R=(檢出相關(guān)文獻(xiàn)量/系統(tǒng)文獻(xiàn)庫中相關(guān)文獻(xiàn)總量)×100% 查準(zhǔn)率(precision):指系統(tǒng)在進行某一檢索時,檢出的相關(guān)文獻(xiàn)量占檢出的文獻(xiàn)總量的比率,它反映每次從該系統(tǒng)文獻(xiàn)庫中實際檢出的全部文獻(xiàn)中有多少是相關(guān)的。 P=(檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)學(xué)文獻(xiàn)和文獻(xiàn)檢索概論
- 文獻(xiàn)醫(yī)學(xué)文獻(xiàn)檢索
- 醫(yī)學(xué)文獻(xiàn)檢索題庫
- 醫(yī)學(xué)文獻(xiàn)檢索總論-(
- 醫(yī)學(xué)文獻(xiàn)檢索2010
- 醫(yī)學(xué)文獻(xiàn)檢索技巧
- 醫(yī)學(xué)文獻(xiàn)檢索201012
- 醫(yī)學(xué)文獻(xiàn)檢索 1
- 醫(yī)學(xué)文獻(xiàn)檢索課件
- 《醫(yī)學(xué)文獻(xiàn)檢索》ppt課件
- 循證醫(yī)學(xué)文獻(xiàn)檢索案例
- 醫(yī)學(xué)文獻(xiàn)檢索的發(fā)展
- 醫(yī)學(xué)文獻(xiàn)檢索上機習(xí)題
- 醫(yī)學(xué)文獻(xiàn)檢索題庫新
- 醫(yī)學(xué)文獻(xiàn)信息檢索概論
- 醫(yī)學(xué)文獻(xiàn)檢索試題(含答案)
- 醫(yī)學(xué)文獻(xiàn)檢索試題(含答案)
- 《醫(yī)學(xué)文獻(xiàn)檢索》教學(xué)大綱
- 醫(yī)學(xué)文獻(xiàn)檢索基礎(chǔ)知識
- 醫(yī)學(xué)文獻(xiàn)檢索題目及答案
評論
0/150
提交評論