【機構(gòu)庫共享機制研究】機構(gòu)和機制的區(qū)別
發(fā)布時間:2020-03-07 來源: 人生感悟 點擊:
[摘要]通過開放存取發(fā)展趨勢和機構(gòu)庫現(xiàn)狀的研究,從三個角度提出機構(gòu)庫共享的必要性。在信息資源共享原則的基礎(chǔ)上,結(jié)合機構(gòu)庫自身的特點,深入分析機構(gòu)庫的共享原則。最后通過探析機構(gòu)共享發(fā)展階段,結(jié)合OAIS長期存取框架,并利用OAI-PMH互操作協(xié)議,構(gòu)建機構(gòu)庫長期聯(lián)合共享模型。
[關(guān)鍵詞]機構(gòu)庫 資源共享 開放存取 OAIS OAI-PMH
[分類號]G250.74
開放存取(Open Access,簡稱OA)是國際科技界、學(xué)術(shù)界、出版界、信息傳播界為推動科研成果利用網(wǎng)絡(luò)自由傳播而發(fā)起的運動。隨著經(jīng)濟和技術(shù)的發(fā)展,傳統(tǒng)學(xué)術(shù)出版模式嚴重阻滯了學(xué)術(shù)交流的發(fā)展,期刊價格的升幅遠遠超出了機構(gòu)圖書館經(jīng)費預(yù)算所能承受的范圍,圖書館只能在有限的經(jīng)費中削減訂購,而出版商為了保障自己固有的商業(yè)利潤不斷提高期刊價格,這樣圖書館期刊購買經(jīng)費與出版商利潤之間就一直存在著矛盾,形成了一種惡性循環(huán)。國際上實現(xiàn)開放獲取主要有兩種途徑:一種是通過開放獲取期刊(OA Jour-nals),被稱為“金色道路”(Gold Road);另一種是通過作者自存儲(Author self-archiving)將個人研究成果存儲到開放獲取知識庫中,被稱為“綠色道路”(GreenRoad)。
開放存取的發(fā)展,加之web技術(shù)的進步,機構(gòu)庫得以迅速發(fā)展。機構(gòu)庫基于開放存取理念而建立,作為開放獲取運動最重要的模式之一,機構(gòu)庫在保存機構(gòu)的學(xué)術(shù)成果、求得成果內(nèi)容永久的揭示與獲取,增加學(xué)者個人、單位和院系研究的可見性,替代商業(yè)出版社的壟斷出版行為等方面發(fā)揮重要作用,對作者、用戶、大學(xué)和課題資助者及圖書館等各方都有好處,成為網(wǎng)絡(luò)學(xué)術(shù)交流體系中的主要組成部分。國外許多機構(gòu)都在進行知識庫的建設(shè),許多國家和研究機構(gòu)也制定各種政策扶持機構(gòu)庫的研究與運作,包括強制性開放獲取政策。全球的機構(gòu)庫處于高速增長時期,如今機構(gòu)庫已經(jīng)成為圖書館研究的熱點,并成為開放存取運動的主角。
1、機構(gòu)庫簡介
1.1 機構(gòu)庫概念
目前,國內(nèi)外關(guān)于機構(gòu)庫的研究和應(yīng)用很多。但是對機構(gòu)庫的概念上仍存在分歧。但是筆者認為他們只是研究的視角不同而已,對機構(gòu)庫本質(zhì)內(nèi)容的定義大體是一致的:機構(gòu)庫是對特定范圍內(nèi)的知識資源進行搜集、組織、數(shù)字存儲、管理,并最終將其中絕大部分資源對任何網(wǎng)絡(luò)用戶免費共享的知識庫。
1.1.1 機構(gòu)庫發(fā)展現(xiàn)狀 2000年惠普公司斥資1800萬美元,與麻省理工學(xué)院(Massachusetts institution oftechnology,MIT)合作開發(fā)DSpace;2001年,俄亥俄州立大學(xué)的行政官員和該館館長布蘭寧(Joseph J.Bra.nin)在探頭開發(fā)遠程教育體系時,提出建立俄亥俄州立大學(xué)知識庫,以保存該校師生員工的數(shù)字資源,這成為機構(gòu)庫最初的雛形。2002年11月DSpace正式面世,機構(gòu)庫以不可思議的速度在全球范圍內(nèi)迅速擴展,并朝著全球知識共享的目標邁進。
目前全球機構(gòu)庫建設(shè)正處于高速增長期,根據(jù)著名機構(gòu)庫登記機構(gòu)Registry of Open Access Repositories(ROAR)的統(tǒng)計結(jié)果顯示:截止到2009年2月,全球機構(gòu)庫已經(jīng)增加至l 256個,記錄數(shù)據(jù)達上千萬條(12 616 668),如圖1所示:
機構(gòu)庫發(fā)展迅速但是發(fā)展卻不平衡,根據(jù)著名機構(gòu)庫登記機構(gòu)Registry of Open Access Repositories(ROAR)的統(tǒng)計結(jié)果顯示,排名前五名的是:美國(266),英國(131),德國(99),日本(64),巴西(63)和西班牙,加拿大(48)。中國等發(fā)展中國家則發(fā)展相對落后,如圖2所示:
2、機構(gòu)庫共享機制研究的必要性
2.1 機構(gòu)庫構(gòu)建中存在著隱患
全球機構(gòu)庫的數(shù)量迅速猛增,許多機構(gòu)都在積極籌建機構(gòu)庫。但是在建庫的過程中,各機構(gòu)正處于獨自競爭發(fā)展階段,旨在建立適合本機構(gòu)的知識庫。短期來看,這對于機構(gòu)庫的發(fā)展,機構(gòu)庫的質(zhì)量提高都大有益處。但從長遠角度考慮,機構(gòu)庫現(xiàn)在的構(gòu)建存在著隱患:各機構(gòu)建庫標準不統(tǒng)一,相互協(xié)調(diào)不足,加之技術(shù)等因素,很難實現(xiàn)各機構(gòu)庫的聯(lián)合共享,這樣必然造成資源的重復(fù)建設(shè),不益于機構(gòu)庫的長期發(fā)展。在機構(gòu)庫的構(gòu)建中,必須始終強調(diào)其共享性。
2.2 開放存取的必然要求
機構(gòu)庫源于開放存取的發(fā)展,機構(gòu)庫是基于開放存取理念建立的。所以機構(gòu)庫必須始終堅持開放存取的目標――共享。這樣才能和一般的學(xué)科庫相區(qū)別,發(fā)揮自身的優(yōu)勢。機構(gòu)庫在發(fā)展過程中要充分考慮本機構(gòu)的特點和需求,真正實現(xiàn)為機構(gòu)服務(wù)。但長遠來看更要注重共享,尤其是跨機構(gòu)共享,這樣才能利用整合最新的資源,進一步推進創(chuàng)新。
2.3 機構(gòu)庫發(fā)展趨勢
現(xiàn)在的研究熱點多聚焦于特定機構(gòu)庫的構(gòu)建之中。如機構(gòu)庫質(zhì)量控制,長期保存問題等。但機構(gòu)庫發(fā)展的趨勢無疑是更好的共享、更廣范圍內(nèi)的共享,終極目標是實現(xiàn)全球范圍內(nèi)資源聯(lián)合共享。
3、機構(gòu)庫共享原則
作為信息資源管理的一種方式,信息資源共享的一般原則,在機構(gòu)庫共享中同樣適用。
3.1 信息資源共享的一般原則
信息資源共享的最終目的是最大限度滿足用戶的信息資源需求?梢詫⑵涓爬椤5A理論”,即任何用戶(Any user)在任何時(Anytime)、任何地點(Any-where),均可以獲得任何圖書館(Any library)擁有的任何信息資源(Any information resource)。
信息資源共享理論的基本原則主要體現(xiàn)在以下幾點:
?自愿原則:自愿原則是信息資源共享的前提原則。所謂自愿原則是指信息資源共享的參與者主觀意志和主觀行為的自覺、自主、自為和自律。
?平等原則:平等原則是信息資源共享的基礎(chǔ)原則。只要是信息資源共享的參與者,在信息資源共享的體系中就都具有平等的責任、權(quán)利和義務(wù)。
?互惠原則:互惠原則是信息資源共享的根本原則。它是指所有參與者在信息資源共享中彼此之間都能夠獲得平等的利益,并由此最大限度滿足用戶的信息資源需求。
3.2 機構(gòu)庫共享原則
3.2.1 標準化原則 標準化是機構(gòu)庫共享中的首要原則,根據(jù)中國標準化協(xié)會的定義,所謂標準是指在一定范圍內(nèi)獲得最佳秩序,對活動或其結(jié)果規(guī)定共同的和重復(fù)使用的規(guī)則、導(dǎo)則或特性的文件。它包括制定、發(fā)布及實施標準的過程。標準化的重要意義是改進產(chǎn)品、過程和服務(wù)的適用性,防止貿(mào)易壁壘,促進技術(shù)合作。標準化的實質(zhì)和目的是通過制定、發(fā)布和實施標準,達到統(tǒng)一,獲得最佳秩序和社會效益。對于機構(gòu)庫而已,必須遵循標準化原則,這樣才能避免數(shù)字資源早期建設(shè)的“以己為政“的錯誤,防止重復(fù)建設(shè)浪費。在機構(gòu)庫中,在信息資源數(shù)字格式,質(zhì)量標準和使 用的獲取技術(shù)上等,都必須遵從通用的標準,這樣才能在不同機構(gòu)庫之間,甚至在其他的資源存儲系統(tǒng)中實現(xiàn)一個互聯(lián)的共享網(wǎng)絡(luò)體系。
3.2.2 可持續(xù)性原則 機構(gòu)庫發(fā)展中必須堅持可持續(xù)原則,這是機構(gòu)庫共享的前提。可持續(xù)性原則源于第38屆聯(lián)合國大會提出的“持續(xù)發(fā)展”。第38屆聯(lián)合國大會提出“持續(xù)發(fā)展”是21世紀不論發(fā)達國家還是發(fā)展中國家正確處理與協(xié)調(diào)人口、資源、環(huán)境、經(jīng)濟相互關(guān)系的共同發(fā)展戰(zhàn)略,是人類求得生存和發(fā)展的唯一選擇。機構(gòu)庫共享的可持續(xù)性原則,是指共享不應(yīng)只是一個即時理念,而是一個長期的可持續(xù)共享。必須保證資源的長期保持,實現(xiàn)機構(gòu)庫的持續(xù)性共享。
3.2.3 系統(tǒng)性原則 機構(gòu)庫的共享是一個系統(tǒng)性的問題。共享牽涉到共享的多方參與,要用系統(tǒng)的觀點,協(xié)調(diào)各方利益。系統(tǒng)性原則是一個總的指導(dǎo)原則,只有在系統(tǒng)原則的指導(dǎo)下,才有可能真正實現(xiàn)共享。
4、機構(gòu)庫共享階段研究
機構(gòu)庫共享的終極目標是在全球范圍內(nèi)實現(xiàn)不同機構(gòu)庫之間及與其他數(shù)字資源庫的共享聯(lián)盟。從機構(gòu)庫共享程度出發(fā),筆者將機構(gòu)庫的共享發(fā)展大致劃分為4個階段:競爭性獨立發(fā)展階段,機構(gòu)庫間相互共享階段,與其他數(shù)字資源庫的共享階段,遵循OAI協(xié)議的全球共享聯(lián)盟階段,如圖3所示:
4.1 競爭性獨立發(fā)展階段
在機構(gòu)庫發(fā)展初期,各機構(gòu)的主要任務(wù)是構(gòu)建適合本單位的機構(gòu)庫,主要關(guān)注本機構(gòu)的資源數(shù)量及質(zhì)量問題。共享目光基本還沒有涉及到機構(gòu)間共享層面,仍停留在本機構(gòu)資源的共享整合。
我國的機構(gòu)庫發(fā)展大多停滯在這個階段,如香港科技大學(xué)圖書館機構(gòu)庫(HKUST)、圖書館情報學(xué)開放文庫、中國預(yù)印本服務(wù)系統(tǒng)、奇跡文庫等。機構(gòu)庫的數(shù)量和質(zhì)量都沒有達到共享的基本要求。
4.2 機構(gòu)庫間相互共享階段(遵循OAI協(xié)議共享)
機構(gòu)庫發(fā)展到較為成熟的階段,步入正軌。為了最大限度發(fā)揮機構(gòu)庫的作用,各機構(gòu)庫都有尋求相互共享的需求。這種共享,可以是庫內(nèi)容的共享,也可能是庫構(gòu)建及管理經(jīng)驗的共享。由于都為機構(gòu)庫,在遵循OAI協(xié)議的基礎(chǔ)上,能較快達到這個共享階段。
現(xiàn)在國外的機構(gòu)庫發(fā)展比較迅速,在美國,印度等國家,有許多遵循OAI協(xié)議共享的成功實例。如印度Kharagpur的理工中心學(xué)院,就利用OAI互操作協(xié)議,實現(xiàn)了中心學(xué)院和7個學(xué)院分校的共享。
4.3 與其他數(shù)字資源庫的共享階段(異構(gòu)數(shù)據(jù)高度集成)
機構(gòu)庫間實現(xiàn)了共享,資源雖比較豐富,但仍有很多寶貴的資源在各機構(gòu)庫間是無法獲取的,需要從其他數(shù)字資源庫共享(如學(xué)科知識庫,高校數(shù)字檔案館)。機構(gòu)庫要尋求新的發(fā)展空間,必須嘗試實現(xiàn)與與其他數(shù)字資源庫的共享。由于機構(gòu)庫和其他數(shù)字資源庫在構(gòu)建標準上有很多不同,共享的實現(xiàn)有一定難度,在技術(shù)上與標準上都會有很多難題需要解決,但在遵循OAI協(xié)議的基礎(chǔ)上,這個共享階段是可能達到的。
由于資源格式標準不統(tǒng)一,實現(xiàn)聯(lián)合的共享有很多技術(shù)難關(guān)需要攻破。根據(jù)現(xiàn)今的資料,筆者未能找到成功的實例。僅有的也只是把其他資源庫的資源轉(zhuǎn)載到新建的機構(gòu)庫中。如美國馬薩諸塞州的州立醫(yī)學(xué)院,就嘗試過將已有的圖像資源數(shù)據(jù)庫轉(zhuǎn)載到機構(gòu)庫中,但對于技術(shù)實現(xiàn)細節(jié),沒有詳細的說明。
4.4 全球共享聯(lián)盟階段(分布式高度集成共享)
隨著web技術(shù)的發(fā)展,機構(gòu)庫的共享還必須整合因特網(wǎng)的寶貴資源,這樣才能最終實現(xiàn)開放存取,實現(xiàn)最大意義上的共享,形成全球共享聯(lián)盟。
作為機構(gòu)庫發(fā)展的終極目標,國外許多機構(gòu)庫大學(xué)團體,在孜孜不倦的探索著。如加拿大拉瓦爾大學(xué)在一個名為Archime"de的項目中,就提供了分布式高度集成共享的技術(shù)實現(xiàn)框架。里面使用了新的OAI―PMH2互操作協(xié)議,并提供了索引和搜索的框架(Ll-us)及GPL許可協(xié)議,用于實現(xiàn)不同標準資源格式的互聯(lián)網(wǎng)分布共享。其中涉及較多技術(shù)細節(jié),有待進一步考證,但可以預(yù)計在不遠的將來,全球共享聯(lián)盟階段的前景是光明的。
5、機構(gòu)庫共享模型構(gòu)建
機構(gòu)庫的共享是一個系統(tǒng)的工程,機構(gòu)庫內(nèi)容的搜集、錄入、管理、共享利用必須堅持系統(tǒng)的觀點,相互協(xié)調(diào)。同時機構(gòu)庫共享必須在可持續(xù)原則指導(dǎo)下,實現(xiàn)長期的可存取性。因此,筆者基于OAIS參考模型與OAI-PMH共享協(xié)議,搭建了機構(gòu)庫共享模型。
5.1 OAIS參考模型
1995年,在國際標準化組織(ISO)的請求下,美國國家航空和航天局的空間數(shù)據(jù)系統(tǒng)咨詢委員會(Consultative Committee for Space Data Systems.CCS-DS)開始開發(fā)一個旨在對數(shù)字資源的存取標準和長期保存規(guī)定概念和參考框架。CCSDS的這一工作導(dǎo)致1999年5月開放檔案信息系統(tǒng)(Open Archival Informa-tion system,OAIS)參考模型的雛形公布,這一參考模型針對數(shù)字信息的長期保存和維護的檔案系統(tǒng)提供一個概念性的框架。OAIS參考模型提供了一個完整的檔案信息保存功能,它包括攝入、檔案存儲、數(shù)據(jù)管理、存取和分發(fā)。
5.1.1 OAIS的環(huán)境 OAIS觀點認為,一個OAIS是一個置身于生產(chǎn)者、用戶和管理者之間的一個存檔體系,如圖4所示:
?信息生產(chǎn)者:是指提供用于保存信息的人員或客戶端系統(tǒng)。
?管理者:是指那些制定數(shù)字檔案館系統(tǒng)全部政策的角色,它的唯一職責是通過制定政策控制檔案的有效管理。管理者不參與日常檔案業(yè)務(wù)操作,日常檔案管理職責由數(shù)字檔案館系統(tǒng)中的管理功能實體完成。
?用戶:是指通過與數(shù)字檔案館服務(wù)交互,發(fā)現(xiàn)與獲取對數(shù)字信息感興趣的人員或客戶端系統(tǒng)。
5.1.2 機構(gòu)庫功能模型在OAIS的基礎(chǔ)上,筆者提出了機構(gòu)庫功能模型,其中包括6個功能實體和3種信息包。(見圖5)。
提交功能:提交功能模塊負責接收機構(gòu)成員提交文獻的信息包(SIP)。
元數(shù)據(jù)管理:元數(shù)據(jù)管理模塊負責管理日常的數(shù)據(jù)長期存儲的操作過程。
電子文獻歸檔:電子文獻歸檔模塊負責將各種數(shù)據(jù)化信息存儲在保存系統(tǒng)中。
系統(tǒng)管理:系統(tǒng)管理模塊負責監(jiān)控各個模塊的運行。
保存規(guī)劃:保存規(guī)劃模塊負責制定機構(gòu)庫功能模型的保存策略。
存取功能:存取模塊具有負責允許用戶檢索所需信息的功能,同時附有權(quán)限認證與管理功能。
5.2 OAI-PMH互操作框架
OAI-PMH元數(shù)據(jù)收割協(xié)議(Open Archives Initia-tive Protocol for Metadata Harvesting),是一種獨立于應(yīng)用的、能夠提高資源共享范圍和能力的互操作協(xié)議標準。它具有操作容易、開放性,采用XML與HTrP等開放標準,相容性高等優(yōu)點。
OAI-PMH提供了一個基于元數(shù)據(jù)收獲的與應(yīng)用無關(guān)的互操作框架,如圖6所示:
在OAI互操作框架中,OAI―PMH定義了兩個角 色:數(shù)據(jù)提供方DP(Data Provider)和服務(wù)提供方sP(Service Provider)。數(shù)據(jù)提供方和服務(wù)提供方通過OAIRequest和OAI Response來實現(xiàn)信息的傳遞。服務(wù)提供方通過OAI Request從數(shù)據(jù)提供方中獲取元數(shù)據(jù),數(shù)據(jù)提供方對來自服務(wù)提供方的OAIRequest做出響應(yīng),并以O(shè)AI Response格式向服務(wù)提供方提供元數(shù)據(jù)。一個服務(wù)提供方可從多個數(shù)據(jù)提供方處獲取元數(shù)據(jù),而一個數(shù)據(jù)提供方可向多個服務(wù)提供方提供元數(shù)據(jù),數(shù)據(jù)提供方與服務(wù)提供方之間是多對多的關(guān)系。
在實際中,SP與DP可以是不同機構(gòu),也可以屬于同一機構(gòu),因為大多數(shù)機構(gòu)既是服務(wù)提供者也是數(shù)據(jù)提供者。
5.3 基于OAIS與OAI-PMH的機構(gòu)庫共享模型
機構(gòu)庫的長期可存取是實現(xiàn)共享的基礎(chǔ),在充分了解機構(gòu)庫資源長期存取框架OAIS的基礎(chǔ)上,結(jié)合OAI-PMH標準協(xié)議就可以實現(xiàn)機構(gòu)庫資源共享機制模型,如圖7所示:
在機構(gòu)庫共享機制模型中,機構(gòu)庫之間構(gòu)成了一個共享聯(lián)盟,在遵循OAIS參考框架與OAI-PMH協(xié)議的前提下,實現(xiàn)了機構(gòu)庫之間資源的共享。當提交者將文件提交到機構(gòu)庫存儲系統(tǒng)中時,系統(tǒng)以SIP形式提交內(nèi)容信息,包括元數(shù)據(jù)信息與內(nèi)容信息實體,在所提交的SIP得到確認后,管理者根據(jù)保存規(guī)劃(存儲內(nèi)容開放期限、提交內(nèi)容標準與政策等)對所確認的SIP進行存儲,并賦予其相應(yīng)的管理與描述性元數(shù)據(jù)進行存儲與管理維護,然后通過DIP根據(jù)用戶查詢指令響應(yīng)結(jié)果集。每個機構(gòu)庫作為全球數(shù)字資源管理系統(tǒng)的重要組成部分,同時也是機構(gòu)庫共享技術(shù)標準接口OAI-PMH協(xié)議中的一個數(shù)據(jù)提供方(DP),當用戶通過服務(wù)提供方(SP),例如OAIster等提供的統(tǒng)一檢索界面發(fā)出搜索請求時,服務(wù)提供方的采集器將采集到的數(shù)據(jù)進行處理、重組,建立索引,將采集的已經(jīng)處理好的數(shù)據(jù)存儲到數(shù)據(jù)庫,通過統(tǒng)一檢索界面返饋給用戶。
在基于OAI-PMH協(xié)議的機構(gòu)庫共享機制模型中,無論是作為數(shù)據(jù)提供方的機構(gòu)庫,還是作為服務(wù)提供方的搜索引擎,都必須通過注冊服務(wù)器進行注冊,機構(gòu)庫在注冊成功并獲得分配URL地址之后,才能發(fā)布元數(shù)據(jù)及響應(yīng)回答服務(wù)提供方的請求,服務(wù)提供方在注冊成功并獲得分配的URL地址后,才能組織和管理元數(shù)據(jù),只有這樣才能真正實現(xiàn)機構(gòu)庫的資源共享。
5.4 共享模型前景展望
由共享機制模型可以看出,機構(gòu)庫之間的共享只是機構(gòu)庫共享的一個組成部分,對機構(gòu)庫來說,其所遵循的標準是其構(gòu)成整個數(shù)字資源共享的重要平臺,只要其他數(shù)字知識庫與機構(gòu)庫之間在長期存取框架下通過遵循OAI-PMH協(xié)議實現(xiàn)元數(shù)據(jù)的互操作,就可以實現(xiàn)資源共通互聯(lián),真正形成共享的網(wǎng)絡(luò)體系與網(wǎng)絡(luò)聯(lián)盟。
相關(guān)熱詞搜索:機制 機構(gòu) 共享 機構(gòu)庫共享機制研究 高校機構(gòu)庫實現(xiàn)機制研究 共享庫機制的研究doc doc
熱點文章閱讀