開放數(shù)據(jù)及其應(yīng)用現(xiàn)狀_第1頁
已閱讀1頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p>  開放數(shù)據(jù)及其應(yīng)用現(xiàn)狀</p><p>  摘 要:開放數(shù)據(jù)是一種理念與實踐,按照用戶特定的需求和相應(yīng)的互聯(lián)網(wǎng)協(xié)議、規(guī)則、框架對Web數(shù)據(jù)進行開發(fā)、加工、存儲、組織等管理活動,以實現(xiàn)局域和全部Web空間的數(shù)據(jù)開放、互通、共享。文章探討了開放數(shù)據(jù)在科學(xué)學(xué)術(shù)交流、Web2.0時代信息組織中的愿景,重點介紹了開放數(shù)據(jù)在當今電子政務(wù)中的應(yīng)用現(xiàn)狀,以及非營利性組織、企業(yè)對開放數(shù)據(jù)的推動情況。 </

2、p><p>  關(guān)鍵詞:開放數(shù)據(jù) 信息組織 開放政府數(shù)據(jù) 關(guān)聯(lián)數(shù)據(jù) </p><p>  中圖分類號: G250.73 文獻標識碼: A 文章編號: 1003-6938(2011)04-0042-06 </p><p>  Current Status of Open Data and Its Application </p><p>  Tan

3、 Jian (Department of Information Resources Management, ZheJiang University, Zhejiang Hangzhou, 310027) </p><p>  Abstract:Based on user's needs and certain Internet protocol, rules and framework, open da

4、ta is a management philosophy and practice including developing, proceeding, storing and organizing web data, so as to realize the goal of open, interconnected, shared web space. This paper discusses open data's role

5、 in digital scholarly communication and information organization. It also highlights its application status in e-government, NGOs, and enterprises as well. </p><p>  Key words:open data; information organiza

6、tion; open government data; linked data </p><p>  CLC number: G250.73 Document code: A Article ID: 1003-6938(2011)04-0042-06 </p><p>  隨著新的技術(shù)、標準、協(xié)議、應(yīng)用等不斷涌現(xiàn),全球互聯(lián)網(wǎng)發(fā)展正面臨著機遇與挑戰(zhàn)并存的局面?!叭f維網(wǎng)之父” Tim Bern

7、ers-Lee在展望未來互聯(lián)網(wǎng)時強調(diào)其三大主要特征為:數(shù)據(jù)整合、多樣的網(wǎng)絡(luò)和獨立的設(shè)備、無所不在的Web應(yīng)用[1 ],其中“數(shù)據(jù)整合”(Data Integration)即指在相應(yīng)的網(wǎng)絡(luò)標準格式(如Resource Description Framework、Web Ontology Language等)下實現(xiàn)整個Web的數(shù)據(jù)互聯(lián)互通、開放共享。 </p><p>  全面的數(shù)據(jù)整合和無所不在的Web應(yīng)用客觀上要

8、求現(xiàn)有的互聯(lián)網(wǎng)不斷進行技術(shù)、理念的創(chuàng)新與突破,在向第二代互聯(lián)網(wǎng)演進過程中,開放數(shù)據(jù)成為繼開源軟件、開放存取后又一崇尚開放、自由、共享精神的研究熱點,也為當前數(shù)字化網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)管理、信息組織的研究與實踐注入了新的活力。 </p><p><b>  1 開放數(shù)據(jù)概念 </b></p><p>  當前,人們對“開放數(shù)據(jù)”尚無統(tǒng)一的定義,不同的組織、機構(gòu)有不同的理解,

9、如“開放數(shù)據(jù)中心聯(lián)盟”(Open Data Center Alliance)視之為公司IT基礎(chǔ)設(shè)施、云計算的應(yīng)用模式與解決方案[2 ];學(xué)術(shù)出版和學(xué)術(shù)資源聯(lián)盟(SPARC)主張它為科學(xué)數(shù)據(jù)的一種新型學(xué)術(shù)出版模式、理念[3 ];W3C倡導(dǎo)的“開放數(shù)據(jù)運動”則是采用RDF數(shù)據(jù)模型,在網(wǎng)絡(luò)空間中不同類型和來源的數(shù)據(jù)實體之間建立“RDF鏈接”,從而用特定的語義網(wǎng)瀏覽器或搜索引擎為用戶在普通的HTML網(wǎng)頁和結(jié)構(gòu)化數(shù)據(jù)中導(dǎo)航,最終實現(xiàn)人人都可自由地

10、獲取到其想要數(shù)據(jù)的目標[4 ]。 </p><p>  盡管各個領(lǐng)域因數(shù)據(jù)應(yīng)用相異而有不同的主張,但以秉持中立(neutral point of view)著稱的維基百科對“開放數(shù)據(jù)”的定義可看作是早先興起的其他“開放運動”(如Open Access)的擴展:它是一種哲學(xué)理念及實踐,要求相應(yīng)的數(shù)據(jù)可以被任何人自由獲取,而沒有版權(quán)、專利或其他機制的限制[5 ]。這種定義缺陷在于對“數(shù)據(jù)”這一關(guān)鍵要素及其應(yīng)用沒有明確

11、的規(guī)定,只提供了一個指導(dǎo)性的原則,即數(shù)據(jù)的無限制、無障礙獲取。故可考慮改進如下:開放數(shù)據(jù),即對Web中產(chǎn)生或存在于Web中的各種類型的數(shù)據(jù),按照用戶特定的需求和相應(yīng)的互聯(lián)網(wǎng)協(xié)議、規(guī)則、框架進行開發(fā)、加工、存儲、組織等管理活動,最終目標是實現(xiàn)局域和全部Web空間的數(shù)據(jù)開放、互通、共享。 </p><p>  2 開放數(shù)據(jù)的愿景 </p><p>  2.1 成為推進學(xué)術(shù)交流、科學(xué)研究的關(guān)鍵角

12、色 </p><p>  數(shù)字學(xué)術(shù)交流(Digital Scholarship Communication)不僅包括學(xué)者在印刷型和數(shù)字出版物發(fā)表論文的全過程,同時也包括利用數(shù)字媒體進行的交流活動,如在個人或團體博客、論壇、討論群上發(fā)表觀點和意見,編輯維基條目,給倉儲或社會網(wǎng)站提交數(shù)據(jù)或?qū)W術(shù)交流的產(chǎn)品等[6 ],這種新的學(xué)術(shù)交流模式最大的特點就是“數(shù)據(jù)驅(qū)動”,這就對研究成果(數(shù)據(jù))的管理、檢索、傳播提出了更高的要求

13、,因此,開放數(shù)據(jù)就被科研團體寄予厚望。 </p><p>  劍橋大學(xué)Peter Murray-Rust教授以化學(xué)實驗為例,闡述了數(shù)據(jù)開放對科研的必要性,提出了支持開放數(shù)據(jù)的八大論據(jù),并被維基百科采用[7 ]:(1)數(shù)據(jù)屬于全人類,如人類基因組、生物、醫(yī)療、環(huán)境數(shù)據(jù);(2)公共資金支持了這些研究,故其數(shù)據(jù)應(yīng)被廣泛獲?。唬?)數(shù)據(jù)由政府機構(gòu)產(chǎn)生或為政府所擁有;(4)事實性數(shù)據(jù)不應(yīng)受到法律上的版權(quán)保護;(5)只有科學(xué)

14、研究產(chǎn)生的數(shù)據(jù)能自由獲取到,其贊助者才能得到最大化的價值;(6)限制對數(shù)據(jù)的再使用會產(chǎn)生“反公共體”(anticommons);(7)人類公共活動的正常運行需要數(shù)據(jù)支持;(8)更佳的數(shù)據(jù)獲取能提升科研新發(fā)現(xiàn)的概率。 </p><p>  2.2 實現(xiàn)數(shù)據(jù)網(wǎng)絡(luò)空間互聯(lián)互通,消除信息孤島 </p><p>  信息孤島是指在社會信息化過程中,由于信息系統(tǒng)、軟件系統(tǒng)數(shù)據(jù)庫之間關(guān)聯(lián)性差,難于互聯(lián)、

15、互通和互操作的弊端,造成數(shù)據(jù)共享性差,信息難以融合貫通,無法實現(xiàn)業(yè)務(wù)協(xié)作,系統(tǒng)效率低,而無法真正實現(xiàn)信息化的問題[8 ]。信息孤島是一個復(fù)雜的現(xiàn)象,廣義上還包括因資源格式、計算機技術(shù)標準、編程語言各異、數(shù)據(jù)交換協(xié)議不統(tǒng)一等而造成的“網(wǎng)絡(luò)數(shù)據(jù)孤島”,它一定程度阻礙了互聯(lián)網(wǎng)的發(fā)展和網(wǎng)絡(luò)信息的有效組織。 </p><p>  當前,“關(guān)聯(lián)數(shù)據(jù)”(Linked Data)是一種新型的開放數(shù)據(jù)服務(wù)。它可以在不同來源的數(shù)據(jù)之

16、間創(chuàng)建鏈接,這些數(shù)據(jù)源可能是兩個處于不同地理位置的機構(gòu)所維護的數(shù)據(jù)庫,也可能是一個機構(gòu)內(nèi)的無法在數(shù)據(jù)層面上進行互操作的不同系統(tǒng),通過發(fā)布和鏈接網(wǎng)上的結(jié)構(gòu)化數(shù)據(jù)[9 ]。例如,W3C SWEO 于2007年7月啟動了“關(guān)聯(lián)開放數(shù)據(jù)項目”,截止到2010年7月,其由203個數(shù)據(jù)集構(gòu)成的關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)中包含了250億條RDF語句,這些語句被3.95億個RDF鏈接相連[10 ],而且這些鏈接正在持續(xù)地增加;此外,世界銀行[11 ]、紐約時報[12

17、 ]等也為公眾開發(fā)了專門的關(guān)聯(lián)數(shù)據(jù)、開放數(shù)據(jù)。隨著開放數(shù)據(jù)運動的深入,網(wǎng)絡(luò)中的私有封閉數(shù)據(jù)比重會越來越小,結(jié)構(gòu)化關(guān)聯(lián)開放數(shù)據(jù)就越來越多,那么消除數(shù)據(jù)孤島、信息孤島,構(gòu)建全球范圍內(nèi)開放、統(tǒng)一的數(shù)據(jù)網(wǎng)絡(luò)空間將變得可能。 </p><p>  2.3 每個人都將是數(shù)據(jù)信息的發(fā)布者和創(chuàng)建者 </p><p>  在以開放協(xié)作、用戶參與為特征的Web2.0時代,開放數(shù)據(jù)的利益相關(guān)者不僅有學(xué)術(shù)團體、I

18、T公司、信息機構(gòu)、政府等,公眾也是極為重要的信息主體。由于Web2.0的信息活動是圍繞用戶開展的,用戶在互聯(lián)網(wǎng)上參與內(nèi)容創(chuàng)造,而不是作為被動的客體,他們貢獻內(nèi)容,傳播內(nèi)容,而且提供了這些內(nèi)容之間的鏈接關(guān)系和瀏覽路徑,從而更好地變革互聯(lián)網(wǎng)的內(nèi)容組織和信息傳播,創(chuàng)造關(guān)聯(lián)性和社會性[13 ]。維基、博客、微博、社會網(wǎng)絡(luò)、社會性書簽等是當前Web2.0的代表性應(yīng)用,每一個人都可以成為網(wǎng)絡(luò)的真正主體,其角色也不再局限于信息受眾和接受者,他們可以在

19、網(wǎng)絡(luò)空間中發(fā)布、創(chuàng)建、修改屬于自己的數(shù)據(jù),為互聯(lián)網(wǎng)建設(shè)貢獻自己的力量。Tim Berners-Lee在TED2009年會演講中鼓勵人們在網(wǎng)絡(luò)中發(fā)布自己的原始數(shù)據(jù)(Raw Data),如文本、圖片、視頻等,并呼吁開放數(shù)據(jù)并重塑我們使用數(shù)據(jù)的方式(即整合并形成深度關(guān)聯(lián))[14 ],描繪了開放數(shù)據(jù)理念指導(dǎo)下的網(wǎng)絡(luò)發(fā)展前景,可見這種基于網(wǎng)民參與的信息自組織方式是一大趨勢。 </p><p>  3 開放數(shù)據(jù)在信息組織中的

20、應(yīng)用現(xiàn)狀 </p><p>  眾所周知,當前網(wǎng)絡(luò)中的數(shù)據(jù)信息量正以指數(shù)級別增長,海量、異構(gòu)、無序、多元的數(shù)據(jù)特征使網(wǎng)絡(luò)信息組織面臨著巨大的挑戰(zhàn),元數(shù)據(jù)、語義網(wǎng)、云計算、本體等成為現(xiàn)代信息組織的關(guān)鍵技術(shù),而開放數(shù)據(jù)不僅是一種理念,它能與這些技術(shù)相結(jié)合而成為網(wǎng)絡(luò)信息組織的有效實踐。 </p><p>  由于開放數(shù)據(jù)具有基于本身數(shù)據(jù)集(技術(shù)層面的應(yīng)用)和“開放性”(社會層面的保障)兩種增值方

21、式,使得開放數(shù)據(jù)在信息組織中的應(yīng)用朝兩個方向分別發(fā)展:公共信息服務(wù)領(lǐng)域(政府、科研組織等)和商業(yè)應(yīng)用領(lǐng)域[15 ]。開放數(shù)據(jù)源起于科學(xué)研究和創(chuàng)新的訴求,但政府部門早期就起到了極大的推動作用,如2004年所有的經(jīng)濟合作與發(fā)展組織(OECD)成員國的科技部長簽署了一個宣言,提倡所有的獲公共資金支持得到的檔案數(shù)據(jù)都應(yīng)能被公眾獲取、共享[16 ],隨后為之特別頒布了一個“軟法”(soft-law)性質(zhì)的《公共資助的研究數(shù)據(jù)獲取原則與指南》支持全

22、球性科學(xué)信息系統(tǒng)的健康運作[17 ];另一方面,開放數(shù)據(jù)還是企業(yè)信息資源管理的重要議題,其本身也離不開商業(yè)組織的投入和技術(shù)支持。故以下將按此三類分別進行論述。 </p><p>  3.1 開放數(shù)據(jù)在電子政務(wù)中的應(yīng)用現(xiàn)狀 </p><p>  隨著開放環(huán)境下公民參與意識的進一步加強,傳統(tǒng)的政府治理、決策制定、公共服務(wù)方式已難以滿足人們的期望,open government、governme

23、nt 2.0、governance web等理念應(yīng)運而生。簡單地說,Government 2.0可視為e-government在Web2.0時代的新型應(yīng)用,它始于政府開放原先所封閉的、提升透明度、革除阻礙創(chuàng)新的舊體制,這種形態(tài)的政府應(yīng)當:向外部世界開放其門戶;與每一位公民合作以謀求創(chuàng)新;共享原先壁壘森嚴的資源;充分利用大眾協(xié)作的力量;作為一個真正集成的組織運轉(zhuǎn)而不是孤立部門或管轄權(quán)(的行使者)[18 ]。從以上不難看出,開放數(shù)據(jù)是未來電

24、子政務(wù)發(fā)展的必要條件,開放政府是未來政府勝任角色挑戰(zhàn)的必然選擇。本文選擇美國、加拿大、英國三個國家,介紹開放數(shù)據(jù)在電子政務(wù)中的應(yīng)用現(xiàn)狀。 </p><p><b> ?。?)美國政府 </b></p><p>  2009年1月21日,新當選的美國總統(tǒng)奧巴馬簽署了他上任后的第一份備忘錄就是《透明和開放的政府》[19 ],決心“致力于讓政府開放程度提高到一個前所未有的水

25、平”;指出“政府應(yīng)該是透明的、具有高參與水平的、合作協(xié)調(diào)的”,并責(zé)成聯(lián)邦管理和預(yù)算局(OMB)負責(zé)人起草《開放政府令》(Open Government Directive),以具體行動貫徹這些原則。隨后白宮建立了專門的“開放政府計劃”(Open Government Initiatives)網(wǎng)站[20 ],公民在此可定制政府出版物、尋找政府數(shù)據(jù)、查閱聯(lián)邦政府投資及財稅收入的使用情況,還可參與監(jiān)督和評論開放政府執(zhí)行進展、提供相關(guān)解決方案等

26、。 </p><p>  經(jīng)“頭腦風(fēng)暴”方式廣泛征求公民意見后,第37任OMB局長Peter R. Orszag 向白宮提交了《開放政府令》并獲批準,該法案要求聯(lián)邦政府機構(gòu)和執(zhí)行部門采取以下措施推進更加開放的政府建設(shè)[21 ]:①支持信息開放,以開放格式在線發(fā)布政府信息,尊重公眾知情權(quán)和公眾參與;②提高公眾獲取政府信息的質(zhì)量,遵守OMB的《Information Quality Act》和其他信息質(zhì)量規(guī)定,各機構(gòu)

27、需指定一名高級官員對本部門信息質(zhì)量負責(zé);③創(chuàng)造一種開放政府的文化并使其制度化,整合部門內(nèi)政策、法律、技術(shù)等資源發(fā)展出更好的開放政府方案;④為開放政府創(chuàng)造一種有力的政策框架,重視新技術(shù)的應(yīng)用,必要時修訂現(xiàn)有的信息法案。該法案對開放政府事項之“透明度、參與、協(xié)作”三大原則作了詳細的說明和規(guī)定,美國所有的聯(lián)邦政府機構(gòu)都需據(jù)此提交各自的“開放政府計劃”,重視公眾對其開放計劃與實踐的反饋、評價意見。 </p><p>  

28、當前,美國聯(lián)邦政府層面的開放數(shù)據(jù)項目除了前文提到的奧巴馬政府Open Government Initiatives外,另一著名的當屬聯(lián)邦CIO委員會開發(fā)、總務(wù)管理局主管的Data.Gov[22 ]。該網(wǎng)站以都柏林核心元數(shù)據(jù)集(DC)為標準,采用目錄(catalogs)方式組織政府數(shù)據(jù)和其他應(yīng)用型網(wǎng)絡(luò)工具,提供類目、機構(gòu)、關(guān)鍵詞等搜索途徑,資源主要有三大類型:①“原始數(shù)據(jù)(Raw Data)目錄”除提供可機器識別、即時瀏覽下載的無關(guān)平臺的

29、政府數(shù)據(jù)資源(這些數(shù)據(jù)大多以XML、Text/CSV、KML/KMZ, Feeds, XLS等格式呈現(xiàn))外,還有相關(guān)鏈接指向各個數(shù)據(jù)集的元數(shù)據(jù)頁面,這些元數(shù)據(jù)頁面上又有其他的鏈接指向有權(quán)威信息來源的聯(lián)邦機構(gòu),從而形成數(shù)據(jù)關(guān)聯(lián)網(wǎng)絡(luò);②“工具目錄”則以超鏈接形式為公眾獲取聯(lián)邦數(shù)據(jù)提供服務(wù),例如虛擬交互工具、數(shù)據(jù)挖掘和抽取工具、RSS定制等,用戶可以便捷地從中選擇自己感興趣的數(shù)據(jù);③“地理數(shù)據(jù)目錄”致力于提供可信、權(quán)威的聯(lián)邦地理數(shù)據(jù),用戶可在

30、此鏈接至這些數(shù)據(jù)的下載頁面、元數(shù)據(jù)描述頁面或其他更加詳細站點,如聯(lián)邦地理數(shù)據(jù)委員會的元數(shù)據(jù)信息。值得一提的是,Data.</p><p><b>  (2)加拿大政府 </b></p><p>  《信息獲取法案》(Access to Information Act)是加拿大聯(lián)邦政府信息公開的法律依據(jù),該法案于1983年起生效,其目的是“拓展加拿大現(xiàn)有的相關(guān)法律,依據(jù)

31、政府信息應(yīng)該被公共獲得之原則,(為公民)提供政府機構(gòu)控制下信息的獲取權(quán)”[23 ],此外,各省、地區(qū)也有其各自的信息獲取、信息自由法律。當開放政府數(shù)據(jù)運動興起時,與其他國家由中央政府主導(dǎo)不同的是,加拿大各級地方政府走在前列。如英屬哥倫比亞省2007年7月起向Google Earth 和Google Maps 提供省域內(nèi)的交通、礦產(chǎn)、高速公路工程等更高質(zhì)量、即時更新的數(shù)據(jù)和圖片[24 ];渥太華市[25 ]、多倫多市[26 ]、溫哥華市[

32、27 ]政府等紛紛接受了開放的哲學(xué)理念,建立了專門的開放數(shù)據(jù)門戶網(wǎng)站,為公眾提供在線的政府數(shù)據(jù)目錄或報告。 </p><p>  為了在開放數(shù)據(jù)運動中追趕美國,2010年加拿大聯(lián)邦政府將其提上了議事日程,并加快了行動步伐[28 ]:5月10日,現(xiàn)任執(zhí)政黨保守黨在“數(shù)字經(jīng)濟戰(zhàn)略”中聲稱“政府應(yīng)協(xié)助獲公共資金支持的研究數(shù)據(jù)更好地被加拿大商業(yè)和研究者獲取”;9月1日:“信息獲取與隱私委員會”通過了《開放政府決議》(Op

33、en Government Resolution ),鼓勵各級政府擁護開放政府,積極地以開放格式披露信息;10月21日,自由黨發(fā)布了《自由開放政府計劃》,文件內(nèi)容包括創(chuàng)建一個全國性的開放數(shù)據(jù)網(wǎng)站,促進政府數(shù)據(jù)的公共獲??;11月25日,綠黨建議制定“聯(lián)邦開放數(shù)據(jù)政策”。2011年3月17日,加拿大國家開放數(shù)據(jù)的統(tǒng)一門戶網(wǎng)站opendata.gc.ca正式上線,作為開放數(shù)據(jù)、開放信息、開放對話的趨勢下開放政府的重要嘗試,該網(wǎng)站旨在協(xié)助公眾更

34、好地尋找、下載、使用政府數(shù)據(jù),以期促進公眾參與和創(chuàng)新,并為公眾提供更多的社會、經(jīng)濟機會。 </p><p><b>  (3)英國政府 </b></p><p>  2009年12月7日,前首相布朗在倫敦“smarter government”[29 ]的集會上,聲明將發(fā)布更多的政府數(shù)據(jù)(除個人和敏感數(shù)據(jù)外),如社會治安、醫(yī)院、學(xué)校、交通、地理等原始數(shù)據(jù),并用一站式網(wǎng)

35、站呈現(xiàn),值得一提的是,一些極具前瞻性的開放政府數(shù)據(jù)原則得到了確認,如這些公共數(shù)據(jù)以一種可再使用和機器識別的形式發(fā)布,使用開放標準、遵循W3C的倡議,所有的原始數(shù)據(jù)集以關(guān)聯(lián)數(shù)據(jù)的形式呈現(xiàn)等,這些原則的應(yīng)用對英國取得在全球開放數(shù)據(jù)運動的領(lǐng)先地位有重要意義。 </p><p>  2010年,數(shù)據(jù)民主運動在英國進一步發(fā)展,1月21日,英國政府開放數(shù)據(jù)網(wǎng)站Data.gov.uk[30 ]正式投入使用,迄今它已包含了560

36、0多個來自各政府部門的數(shù)據(jù)集,涉及健康、交通、環(huán)保、社區(qū)、商務(wù)、教育等眾多領(lǐng)域。該網(wǎng)絡(luò)開放平臺由“萬維網(wǎng)之父” Tim Berners-Lee和南安普頓大學(xué)Nigel Shadbolt教授負責(zé)創(chuàng)立,由于在數(shù)據(jù)組織方面使用了高效的國際標準和恰當?shù)募夹g(shù)(如RDF格式、URI、SPARQL查詢語言、關(guān)聯(lián)數(shù)據(jù)API等),因此其數(shù)據(jù)的交互、關(guān)聯(lián)、有效性得到了較好的實現(xiàn),與Data.Gov相比,大有后來居上之勢。新上任的首相卡梅倫提出了一種新的“數(shù)

37、據(jù)權(quán)”(Right to Data)概念,指出這是信息社會一項基本的公民權(quán)利,承諾要繼續(xù)在全社會推向深入并使之制度化;5月25日,英國女王在新一屆議會發(fā)表演講,也強調(diào)要全面保障公眾的“數(shù)據(jù)權(quán)”。此外,“開放政府數(shù)據(jù)”還成為卡梅倫政府“大社會”(big society)施政綱要、“還政于民”社會改革的重要組成部分。 </p><p>  3.2 非營利性組織對開放數(shù)據(jù)的推動 </p><p>

38、;  眾所周知,開源軟件、開放存取等已證明了其巨大的經(jīng)濟效益和深遠的社會效益,非營利性組織在促進全社會接受這些“開放”理念的過程中扮演了重要角色。當前的開放數(shù)據(jù)運動也得到了一些非營利性組織,如科學(xué)團體、互聯(lián)網(wǎng)領(lǐng)導(dǎo)機構(gòu)、圖書館的密切關(guān)注,它們又一次走到了開放數(shù)據(jù)實踐的最前列。 </p><p>  (1)開放知識聯(lián)盟(Open Knowledge Foundation,簡稱OKF),[31 ]是一家旨在推進知識開放

39、(包括任何形式的開放內(nèi)容、開放數(shù)據(jù)、開源軟件服務(wù)等)的非營利性組織,該組織對“開放知識”的定義如下:一條開放的內(nèi)容或數(shù)據(jù),任何人都可以自由使用、再使用、再分發(fā)等,而只需滿足注明其出處和以相同方式共享即可。OKF的主要成果包括:制定了“開放數(shù)據(jù)共享”系列許可,如《開放數(shù)據(jù)庫許可》、《公共領(lǐng)域的貢獻與許可》等;開發(fā)了一個名為CKAN的開源軟件,為數(shù)據(jù)的發(fā)布、搜索、共享提供一個中樞平臺;提供“開放式文本圖書”、“開放經(jīng)濟學(xué)”、“開放莎士比亞”

40、、“開放地理數(shù)據(jù)”等開放數(shù)據(jù)產(chǎn)品;舉辦“2010年開放政府數(shù)據(jù)營”交流活動,來自世界各地的政府代表、學(xué)者、律師、公民等共同探討開放政府數(shù)據(jù)過程中的法律、技術(shù)、政策問題,互相交流經(jīng)驗。 </p><p> ?。?)自2007年起,W3C年會都設(shè)有研討“關(guān)聯(lián)(開放)數(shù)據(jù)”的分會場,其“鏈接開放數(shù)據(jù)項目”目標是使互聯(lián)網(wǎng)最終成為全球性數(shù)據(jù)空間。W3C呼吁每個人、機構(gòu)組織以關(guān)聯(lián)數(shù)據(jù)的原則、標準開放其原始數(shù)據(jù)。為幫助政府科學(xué)

41、、規(guī)范地開放其公共數(shù)據(jù),2009年9月8日,W3C eGov Interest Group 公布了《開放政府數(shù)據(jù)指南》[32 ]文件,提供了開放政府數(shù)據(jù)的標準和方法,例如鼓勵政府以XML、RDF、CSV格式發(fā)布原始數(shù)據(jù)并形成結(jié)構(gòu)化數(shù)據(jù),以在線目錄、完備的文本方式組織這些數(shù)據(jù)集,采用語義、元數(shù)據(jù)、標識等技術(shù)處理數(shù)據(jù),并用URI、RDF使之形成人和機器都可讀的關(guān)聯(lián)數(shù)據(jù)。 </p><p> ?。?)開放數(shù)據(jù)運動正對數(shù)

42、字時代圖書館數(shù)據(jù)政策、數(shù)據(jù)管理的影響,圖書館將以更加開放的姿態(tài)向社會開放公共數(shù)據(jù),例如開源站點?biblios.net采用了類似維基模式向圖書館界提供開放MARC數(shù)據(jù)的開發(fā)、創(chuàng)建、共享、轉(zhuǎn)換服務(wù),目前以3000萬余條數(shù)據(jù)成為全球最大的免費圖書館編目數(shù)據(jù)平臺[33 ],德國國家圖書館[34 ]、大英圖書館[35 ]也宣布對外提供開放數(shù)據(jù)服務(wù)。其他組織,如學(xué)術(shù)與研究型圖書館聯(lián)盟――SPARC,不僅是全球開放存取運動的一支重要力量,現(xiàn)也致力于

43、促進科學(xué)數(shù)據(jù)的開放,倡導(dǎo)允許互聯(lián)網(wǎng)上的科學(xué)數(shù)據(jù)供所有人下載、復(fù)制、分析、再加工、制成軟件或其他任何目的使用而沒有經(jīng)濟、法律或技術(shù)的障礙。2010年2月該組織發(fā)布了“潘頓原則”[36 ](Panton Principles)支持開放數(shù)據(jù)的許可問題解決:①發(fā)布數(shù)據(jù)的時附上一個明確而穩(wěn)妥的愿望聲明;②使用一種適合數(shù)據(jù)的、得到認可的豁免或許可協(xié)議;③為了更有效地使用數(shù)據(jù)和方便他人添加數(shù)據(jù),開放的數(shù)據(jù)應(yīng)遵循OKF關(guān)于“開放知識/數(shù)據(jù)”定義,尤其是

44、不應(yīng)使用限制商業(yè)性應(yīng)用等條款;④發(fā)布的科學(xué)數(shù)據(jù)使用《公共領(lǐng)域的貢獻與許可》或者《知識共享的豁免》</p><p>  3.3 企業(yè)對開放數(shù)據(jù)的響應(yīng) </p><p>  數(shù)據(jù)是企業(yè)的極為重要的資源,是企業(yè)決策和解決方案的依據(jù),開放網(wǎng)絡(luò)環(huán)境下的企業(yè)普遍面臨著數(shù)據(jù)的存儲、組織、挖掘分析等應(yīng)用問題。開放數(shù)據(jù)不僅能為企業(yè)提供與外部客戶、合作伙伴即時而緊密的鏈接網(wǎng)絡(luò),對企業(yè)降低數(shù)據(jù)整合成本、充分利用

45、外部創(chuàng)新環(huán)境從而提升效率和競爭力也有重要意義。下圖體現(xiàn)了企業(yè)開放數(shù)據(jù)追求當今網(wǎng)絡(luò)條件下最佳實踐的一般理念[37 ]: </p><p>  即在企業(yè)內(nèi)部數(shù)據(jù)層面,通過建設(shè)面向網(wǎng)絡(luò)的基礎(chǔ)設(shè)施、開放API、按語義網(wǎng)和關(guān)聯(lián)數(shù)據(jù)原則定位、組織、發(fā)布企業(yè)自身數(shù)據(jù)或相關(guān)網(wǎng)絡(luò)數(shù)據(jù),應(yīng)用層要解決的問題主要是:為外界用戶通過HTTP協(xié)議等其他方式搜索這些數(shù)據(jù)提供方便,設(shè)計面向服務(wù)的系統(tǒng)架構(gòu)(SOA模型)與外界業(yè)務(wù)伙伴、利益相關(guān)者建

46、立新的交互渠道,由關(guān)聯(lián)數(shù)據(jù)等生成綜合應(yīng)用與服務(wù)以及優(yōu)化組織業(yè)務(wù)流程等。 </p><p>  作為國內(nèi)最大的網(wǎng)絡(luò)零售平臺,淘寶網(wǎng)占據(jù)了國內(nèi)C2C市場超過80%的市場份額,積累了海量的關(guān)于消費商品的購買數(shù)據(jù)和信息。2009年6月22日,淘寶開放平臺(Taobao Open Platform,簡稱TOP)發(fā)布,淘寶開放平臺的使命是把淘寶網(wǎng)的商品、用戶、交易、物流等一系列電子商務(wù)基礎(chǔ)服務(wù),像水、電、煤一樣輸送給有需要的

47、商家、開發(fā)者、社區(qū)媒體和各行各業(yè),截至2011年1月,TOP對外開放的API已超過300個,API調(diào)用量已超過6億/日,成為國內(nèi)開放規(guī)模最大,開放程度最深的開放平臺[38 ]。2010年3月31日,淘寶網(wǎng)又正式宣布對外開放交易平臺的海量原始數(shù)據(jù),適合開放的數(shù)據(jù)主要有兩方面:涉及電子商務(wù)行業(yè)的宏觀數(shù)據(jù)以及讓消費者了解最新消費風(fēng)向標的數(shù)據(jù),實行免費開放策略;涉及各個行業(yè)市場情況、消費者行為研究等商業(yè)數(shù)據(jù),通過商業(yè)方式開放[39 ],淘寶數(shù)據(jù)

48、平臺致力于建立“開放、透明、分享、責(zé)任”的新商業(yè)文明生態(tài)圈,成為分享數(shù)據(jù)的第一平臺,這無疑有益于緩解電子商務(wù)市場信息不對稱矛盾,為企業(yè)和消費者決策提供幫助。 </p><p><b>  4 結(jié)語 </b></p><p>  開放數(shù)據(jù)作為一種理念已得到了廣泛的認同,在政府、互聯(lián)網(wǎng)、圖書館等領(lǐng)域的信息組織中的實踐已證明了其廣闊的應(yīng)用空間。開放數(shù)據(jù)的未來增值潛力在于它能

49、成為語義網(wǎng)環(huán)境下關(guān)聯(lián)數(shù)據(jù)組織的數(shù)據(jù)對象,即關(guān)聯(lián)開放數(shù)據(jù)的組織會逐漸成為重點,開放數(shù)據(jù)的終極愿景是:與語義網(wǎng)等新興技術(shù)結(jié)合形成全球性的Web數(shù)據(jù)網(wǎng)絡(luò)、信息空間。 </p><p><b>  參考文獻: </b></p><p>  [1]Tim Berners-Lee. Digital Future of the United States: Part I――The

50、Future of the World Wide Web [EB/OL][2011-03-15].http://dig.csail.mit.edu/2007/03/01-ushou </p><p>  se-future-of-the-web.html. </p><p> ?。?]Open Data Center Alliance. Defining a New Class of Da

51、ta Center and Cloud Infrastructure Solutions [EB/OL].[2011-03-15].http://www.opendatacenteralliance.org/the </p><p>  -alliance. </p><p> ?。?]SPARC. Open Data [EB/OL].[2011-03-15].http://www.arl

52、.org/sparc/opendata/. </p><p> ?。?][10]W3C. Linking Open Data [EB/OL].[2011-03-15].http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData#FAQ. </p><p> ?。?][EB/OL].[2011-03-1

53、5].http://en.wikipedia.org/wiki/Open_Data. </p><p> ?。?]秦健.由數(shù)字學(xué)術(shù)交流引起的思考 [J].圖書情報工作,2009,(16):5-6. </p><p>  [7]Peter Murray-Rust.Open Data in Science [J].Series Review,2008,(1):52-64. </p>

54、<p>  [8]王俊杰. 沖出信息孤島,實現(xiàn)數(shù)字資源共享[J].大學(xué)圖書館學(xué)報,2004,(3):16-18. </p><p> ?。?]潘有能,張悅.關(guān)聯(lián)數(shù)據(jù)研究與應(yīng)用進展[J].情報科學(xué),2011,(1):124-130. </p><p> ?。?1]World Bank. Data[EB/OL].[2011-03-15].http://data.worldbank

55、.org. </p><p>  [12]New York Times. Linked Open Data (Beta) [EB/OL].[2011-03-15].http://data.nytimes.com/. </p><p> ?。?3]熊回香. Web2.0環(huán)境下的網(wǎng)絡(luò)信息組織[J].情報資料工作,2007,(5):29-32. </p><p> ?。?

56、4]TED Talks. Tim Berners-Lee on the next Web [EB/OL].[2011-03-15].http://www.ted.com/index.php/talks </p><p>  /tim_berners_lee_on_the_next_web.html. </p><p> ?。?5]李佳佳. 信息管理的新視角―開放數(shù)據(jù)[J].情報理論與實踐,

57、2010,(10):35-39. </p><p> ?。?6]OECD. Science, Technology and Innovation for the 21st Century. Meeting of the OECD Committee for Scientific and Technological Policy at Ministerial Level [EB/OL].[2011-03-15].h

58、ttp://www.oecd.org/document/0,2340,en_2649_34487_25998799_1_1_1_1,00.html. </p><p> ?。?7]OECD. OECD Principles and Guidelines for Access to Research Data from Public Funding[EB/OL].[2011-03-15].http://www.oe

59、cd.org/document/55/0,3343,en_ </p><p>  2649_201185_38500791_1_1_1_1,00.html. </p><p>  [18]Don Tapscott, Anthony D. Williams, Dan Herman. Government 2.0:Transforming Government and Governance f

60、or the Twenty-First Century[R].New Paradigm,2008. </p><p>  [19]Barack Obama. The Memorandum for the Heads of Executive Departments and Agencies on Transparency and Open Government[EB/OL].[2011-03-15].http:/

61、/www.whitehouse.gov/the_press_office/Transparency_and_Open_ </p><p>  Government. </p><p>  [20]The White House-the Administration. Open Government Initiatives[EB/OL].[2011-03-15].http://www.whi

62、tehouse.gov/open/about/initiatives. </p><p>  [21]The White House-the Administration. Open Government Directive[EB/OL].[2011-03-15].http://www.whitehouse.gov/open/documents/open-government-directive. </p&

63、gt;<p> ?。?2][EB/OL].[2011-03-15].http://www.data.gov/. </p><p>  [23]Department of Justice.The Access to Information Act 1983[EB/OL].[2011-03-17].http://laws.justice.gc.ca/eng/A-1/20110323/page-0.htm

64、l rp2=SEARCH&rp3=SI&rp1=information%20&rp4=all&rp9=cs&rp10=L&rp13=50#idhit1. </p><p>  [24]Vancouver Sun.Google Earth eyes partnership with B.C. governments[EB/OL].[2011-03-20].http:/

65、/www.canada.com/vancouversun/news/business/story.html?id=9a33 </p><p>  1eff-ae47-4609-b7cf-3452a742c64a&. </p><p> ?。?5][EB/OL].[2011-03-20].http://ottawa.ca/opendata. </p><p>

66、  [26][EB/OL].[2011-03-20].http://www.toronto.ca/open. </p><p> ?。?7][EB/OL].[2011-03-20].http://data.vancouver.ca/. </p><p> ?。?8][EB/OL].[2011-03-20].http://en.wikipedia.org/wiki/Open_Data_in_

67、Canada. </p><p> ?。?9]Gordon Brown. Speech on Smarter Government[EB/OL].[2011-03-20].http://webarchive.nationalarchives.gov.uk/+/number10.gov.uk/news/speeches-and-transcripts/2009/12/speech-on-smarter-govern

68、ment-21633. </p><p> ?。?0][EB/OL].[2011-03-20].http://data.gov.uk/. </p><p>  [31][EB/OL].[2011-03-20].http://okfn.org/. </p><p> ?。?2][EB/OL].[2011-03-20].http://www.w3.org/TR/gov-

69、data/. </p><p> ?。?3][EB/OL].[2011-03-21].http://biblios.net/faq. </p><p> ?。?4]German National Library.Linked data service of the German National Library[EB/OL].[2011-03-21].http://www.d-nb.de/

70、eng/hilfe/service/linked_data_service.htm. </p><p> ?。?5]The British Library.Free data service[EB/OL].[2011-03-21].http://www.bl.uk/bibliographic/datafree.html. </p><p>  [36][EB/OL].[2011-03-21

71、].http://pantonprinciples.org/. </p><p> ?。?7]Widgetti. The future of enterprise data in a radically open and Web-based world [EB/OL].[2011-03-22]http://www.widgetti.com/wordpress/?p=38. </p><p>

72、;  [38]淘寶網(wǎng)開放平臺 [EB/OL].[2011-03-22]http://my.open. </p><p>  taobao.com/about_top.htm. </p><p> ?。?9]淘寶數(shù)據(jù)平臺 [EB/OL].[2011-03-22]http://blog.shuju.taobao.com/archives/416. </p><p>  

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論