基于都柏林核心(DC)的中醫(yī)文獻元數(shù)據(jù)標準研究.pdf_第1頁
已閱讀1頁,還剩81頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、中醫(yī)在數(shù)千年的發(fā)展長河中,形成了異彩紛呈的醫(yī)學流派,留下了浩如煙海的中醫(yī)古今文獻。中醫(yī)作為珍貴的文化遺產(chǎn),中醫(yī)文獻起到了文化傳承的紐帶作用,記載著幾千年的醫(yī)家智慧、醫(yī)學經(jīng)驗。面對龐大文獻資源,使用者需要高效率的檢索利用和知識發(fā)掘;文獻管理者要對其進行分類整理、權利管理、資源評鑒、妥善保存。中醫(yī)文獻從其產(chǎn)生、傳遞、儲存、到最終消失的過程中有著收集、加工、利用等方面的諸多環(huán)節(jié),其生命周期中蘊含著大量信息,這些在文獻形成和利用中經(jīng)歷的過去事實

2、和文獻資源本身的內(nèi)容一樣都具有一定的記錄價值。人們致力于研究如何在海量中醫(yī)文獻中按特定需求進行查詢檢索,并要盡量返回更為精確的結果。不該僅僅依靠傳統(tǒng)搜索引擎那樣只用關鍵詞機械匹配,而不考慮語義,機械式的查詢往往會返回空白、錯誤或是不符合意圖的結果。元數(shù)據(jù)的應用,對這個問題的解決起到了很大的推動作用。
   2008年10月,中國中醫(yī)科學院中醫(yī)藥信息研究所開始參與ISO/TC215傳統(tǒng)醫(yī)學信息標準化工作,對ISO/TC215傳統(tǒng)醫(yī)

3、學信息標準化的動態(tài)進行了密切關注,并且在ISO/TC215中提交中醫(yī)藥信息國際標準提案“中醫(yī)數(shù)據(jù)集元數(shù)據(jù)標準”,10月份又將“中醫(yī)數(shù)據(jù)集元數(shù)據(jù)標準”改為“中醫(yī)文獻元數(shù)據(jù)標準”。ISO/TC215已于2011年11月對“中醫(yī)文獻元數(shù)據(jù)標準”提案啟動投票程序。2012年5月ISO對“中醫(yī)藥文獻元數(shù)據(jù)”這項標準正式立項。這是我國中醫(yī)藥信息標準在ISO中首次立項。
   本課題是針對已立項的中醫(yī)文獻元數(shù)據(jù)標準著重從的設計原則、制定方法切

4、入,依據(jù)原則與方法建立一套完整的中醫(yī)文獻元數(shù)據(jù)標準體系。
   首先完成了中醫(yī)藥標準發(fā)展的研究背景調(diào)查,調(diào)研國外已有的醫(yī)學元數(shù)據(jù),對國內(nèi)醫(yī)學元數(shù)據(jù)研究現(xiàn)狀在圖書情報和互聯(lián)網(wǎng)的范圍內(nèi)進行調(diào)研。
   描述信息資源的元數(shù)據(jù)有描述傳統(tǒng)印刷型文獻的MARC格式,也有描述網(wǎng)絡信息資源的DC元數(shù)據(jù),還有一種介于MARC和DC之間的第三種元數(shù)據(jù)——MODS;描述醫(yī)學信息的元數(shù)據(jù)有:ISO的健康信息學技術委員會研制的“ISO13119

5、Healthinformatics-Clinical knowledge resources-Metadata(健康信息學-臨床知識資源-元數(shù)據(jù))”標準、Ohio LINK醫(yī)學元數(shù)據(jù)、美國Oregon Health SciencesUniversity制定的醫(yī)學核心元數(shù)據(jù)MCM、法國Rouen University Hospital(RUH)1995年發(fā)起的基于質(zhì)量控制的主題網(wǎng)關項目: CISMeF等。已發(fā)布的這些醫(yī)學元數(shù)據(jù)標準都是很大

6、程度的參考或復用了DC。
   用學術聯(lián)機數(shù)據(jù)庫檢索和互聯(lián)網(wǎng)檢索相結合的方式,發(fā)現(xiàn)國內(nèi)在元數(shù)據(jù)領域已有較多研究,但涉及醫(yī)學領域的元數(shù)據(jù)研究非常少,而中醫(yī)領域更是鮮有問津。國內(nèi)缺乏權威部門牽頭并起草、正式發(fā)布的醫(yī)學元數(shù)據(jù)標準,使中醫(yī)文獻共享缺乏有力支撐,因此本課題有一定研究與開發(fā)的必要性。
   第二,從資源利用、保護等方面分析中醫(yī)文獻元數(shù)據(jù)標準的研究目的與意義,總結元數(shù)據(jù)的功能,分析基于DC設計新的元數(shù)據(jù)的原因。

7、   中醫(yī)文獻收藏地點分散,現(xiàn)存1949年以前的12000多種中醫(yī)文獻目前分散保存在全國各專業(yè)圖書館,仍作為各館的鎮(zhèn)館之寶而束之高閣。學者們在文獻整理研究各個工作環(huán)節(jié)上依然沿用手工作業(yè)的方式。隨著計算機技術應用在文獻管理領域的延伸以及掃描技術的發(fā)展,文獻的電子化處理給讀者帶來極大的閱讀便利;古老的文獻在重建天日的同時能夠獲得很好的保護。國內(nèi)已有或規(guī)劃中的很多中醫(yī)文獻檢索平臺和數(shù)據(jù)庫。與文獻利用的信息技術的發(fā)展形成對比的是文獻利用理論支

8、撐的相對滯后。元數(shù)據(jù)的標準化是文獻利用理論建設的重要環(huán)節(jié),中醫(yī)文獻元數(shù)據(jù)為中醫(yī)藥文獻資源的規(guī)范化描述奠定了基礎,它有助于構建明晰、周全、簡單、易懂的文獻描述性記錄,能有效支持中醫(yī)藥文獻的收集、保管和利用,改善中醫(yī)藥文獻檢索的效果,對于中醫(yī)藥文獻資源的系統(tǒng)保護和深度利用具有重要意義。元數(shù)據(jù)基于DC設計可以避免MARC格式中大量繁瑣的定長字段,使得編目界面變得簡潔而直觀,無論是專業(yè)編目員還是非專業(yè)編目員,都可以參與文獻編目工作,這使編目工作

9、更能適應對龐大的網(wǎng)絡化信息資源的組織。
   第三,設計元數(shù)據(jù)框架,分析元數(shù)據(jù)方案設計的通用原則和具體原則,規(guī)劃中醫(yī)文獻元數(shù)據(jù)的設計流程。
   根據(jù)中醫(yī)文獻生命周期的各項活動和描述角度的不同,將中醫(yī)文獻元數(shù)據(jù)劃分為7個元數(shù)據(jù)子集:
   (1)標識信息子集:外部特征的基本信息,包括名稱,標識符,創(chuàng)建者和出版者,等等。
   (2)內(nèi)容信息子集:關于中醫(yī)文獻內(nèi)部特征的描述信息,包括描述,主題,等等。

10、>   (3)分發(fā)信息子集:關于用戶獲取和收藏文獻資源的信息。
   (4)質(zhì)量信息子集:關于文獻資源保存狀態(tài)的質(zhì)量信息。
   (5)限制信息子集:對資源和元數(shù)據(jù)獲取和使用的限制信息。
   (6)維護信息子集:關于維護保養(yǎng)文獻資源的信息。
   (7)關聯(lián)信息子集:提供了資源之間關聯(lián)關系的參考信息。
   總結了設計元數(shù)據(jù)標準6條通用原則:(1)簡單性與適用性原則;(2)專指度與通用性原則;

11、(3)互操作性與易轉(zhuǎn)換性原則;(4)靈活性與可擴展性原則;(5)用戶需求原則;(6)遵循現(xiàn)有標準原則。
   除了通用原則,針對具體領域元數(shù)據(jù)的制定歸納了條具體原則:(1)資源分析原則(2)擴展原則(元素擴展原則和修飾限定原則)(3).元素定義原則(4)置標原則
   第四,進行本文中醫(yī)文獻元數(shù)據(jù)的相關資源分析,對著錄對象和著錄單位等提出了細節(jié)性的界定。
   “文獻”采用廣義的定義;除中醫(yī)外,傳統(tǒng)醫(yī)學文獻也可適

12、用于此元數(shù)據(jù);當實體文獻資源數(shù)字化后,需對數(shù)字化文本或影像等格式的文獻資源以及實體本身屬性進行著錄,二者結合不可分離;具體著錄單位要按實際需要確定。
   第五,完成了中醫(yī)文獻元數(shù)據(jù)的元素集、元素定義及著錄規(guī)則的具體描述,并用摘要和字典兩種形式進行呈現(xiàn)。
   中醫(yī)文獻元數(shù)據(jù)保留了DC的元數(shù)據(jù)元素集,又包括中醫(yī)藥領域的特征元素。
   重用DC元數(shù)據(jù)元素,如題名(Title)、類型(Type)、創(chuàng)建者(Creat

13、or)、主題(Subject)、描述(Description)、日期(Date)、標識符(Identifier)、語種(Language)、關聯(lián)(Relation)等;
   根據(jù)中醫(yī)藥領域特性,對DC元數(shù)據(jù)元素進行細化,例如將DC中的題名(Title)進一步細化為版心題名(Title on the Fore-edge)、內(nèi)封題名(Title on the InsideCover)、書衣題名(Title on the Book

14、Cover)、卷端題名(Title on the First Page of Text)等;
   添加具有中醫(yī)藥特色的元數(shù)據(jù)元素,例如歷代醫(yī)家、醫(yī)學流派等等。
   第六,選擇合適的網(wǎng)絡描述語言作為本元數(shù)據(jù)的置標語言,實現(xiàn)元數(shù)據(jù)的網(wǎng)絡應用功能。
   RDF(Resource Description Framework),即資源描述框架,是一種用于描述Web資源的標記語言。RDF使用XML語法和RDF Sche

15、ma(RDFS)來將元數(shù)據(jù)描述成為數(shù)據(jù)模型。RDF三元組數(shù)據(jù)模型包括的三種對象類型:
   資源(Resource)。RDF編碼中描述的所有事物都稱為資源。
   屬性(Property)。屬性是用來描述資源的外部特征、內(nèi)容說明或資源間相互關系。
   陳述(Statement)。陳述是用特定模式的語句將資源的屬性及其值表達出來。陳述語句可以和自然語言語句相對應,資源(Resource)對應于自然語言中的主語(S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論