數(shù)字資源整合的發(fā)展趨勢 數(shù)字資源整合的主要目的是什么
發(fā)布時間:2020-03-07 來源: 感恩親情 點擊:
〔摘要〕闡述并分析數(shù)字資源整合領域的理論、應用與技術方面的主要發(fā)展趨勢。數(shù)字資源整合理論研究趨勢主要表現(xiàn)為構建理論框架體系和研究重大的理論觀點;資源整合范圍與規(guī)模的不斷擴大、在信息整合的基礎上進行資源的知識整合以及融入語義網和知識網格,將是數(shù)字資源整合主要應用發(fā)展趨勢;網格、SOA、P2P、Web服務等新型技術將對數(shù)字資源整合的未來產生重大影響。
〔關鍵詞〕數(shù)字資源整合 知識整合 語義網 知識網格 整合技術
〔分類號〕G250.76 TP39
Development Trends of Digital Information Resource Integration
Ma Wenfeng Du Xiaoyong
School of Information Resource Management, Renmin University of China, Beijing 100872
〔Abstract〕This paper analyses the researches and development trends of digital information resource integration in the aspects of theory, application and technology. The paper thinks that the theoretical aspects include constructing a theoretical research framework and proposing some fundamental viewpoints, and that in application aspect, the scope and scale of the digital information resource integration will be extended extremely with the mainly application development trend that knowledge integration will become main stream on the base of data and information integration, and be melted deeply with the semantic web and the knowledge grid. Further, the paper points out that any advance in new technology supporting digital information resource integration, such as grid computing, SOA, P2P and Web service, will make important effects on the research and development of digital information resource integration.
〔Keywords〕digital information resource integration knowledge integration semantic web knowledge grid integration technology
1引言
隨著語義網、知識網格大環(huán)境的逐步形成,數(shù)字資源整合支撐技術的日漸完善,數(shù)字資源整合領域正在悄然并迅速發(fā)生著變化?梢赃@么說,理論、應用、技術,已成為我國數(shù)字資源整合領域重要的話題和發(fā)展脈絡。本文循著這一發(fā)展邏輯,以近年國內外研究成果為基礎,從理論與實踐相結合的層面,探究并分析我國數(shù)字資源整合領域的理論研究、應用研究與技術研究方面的主要發(fā)展趨勢。這三方面是互有關聯(lián),相互滲透的。為了便于說明,分別闡述。
2理論研究趨勢
2.1理論框架研究
2.1.1數(shù)字資源整合理論體系構建研究的必要性首先,從數(shù)字資源整合的可持續(xù)發(fā)展來看,需要理論體系的構建和研究。近些年來,國內相關學科領域對數(shù)字資源整合的研究比較活躍,但整體而言,理論研究相對滯后于實踐的發(fā)展,至今沒有形成公認的核心概念和完整的理論體系。盡管各領域的數(shù)字資源整合實踐呈現(xiàn)出良好的發(fā)展態(tài)勢,但缺乏科學理論體系的支撐,將對整合的可持續(xù)發(fā)展起制約作用。其次,從數(shù)字資源整合實踐面臨的問題來看,需要理論體系的說明與指導。數(shù)字資源整合是信息資源管理發(fā)展中出現(xiàn)的一種新的信息資源管理形態(tài),在其具體的實踐中不可避免地會遇到諸多問題,也常常帶有不同程度的盲目性,因而需要一套系統(tǒng)的、完整的并可應用于數(shù)字資源整合實踐的理論框架,以對實踐中的問題作出科學的解釋,并引導實踐順應科學的態(tài)勢和走向。
2.1.2數(shù)字資源整合理論體系結構研究數(shù)字資源整合的理論體系,是指一套由前后一致的關于數(shù)字資源整合的性質、特點、目標、對象、概念、原則、結構、功能、模式、技術等所組成的概念框架,以用于解釋、評價、指導數(shù)字資源整合的實踐。數(shù)字資源整合的理論體系可以由以下十個地位和作用各不相同的部分組成,它們之間相互滲透、相互作用,從而形成數(shù)字資源整合的理論框架:①數(shù)字資源整合的基礎(理論和方法基礎);②數(shù)字資源整合的目標;③數(shù)字資源整合的對象;④數(shù)字資源整合的概念;⑤數(shù)字資源整合的特征;⑥數(shù)字資源整合的功能;⑦數(shù)字資源整合的原則;⑧數(shù)字資源整合的方式(模式);⑨數(shù)字資源整合的技術;⑩數(shù)字資源整合的環(huán)境。上述十要素,國內相關學科領域都進行了不同程度的研究,但尚未上升到整體性、系統(tǒng)性的研究。數(shù)字資源整合理論體系的構建是一個復雜的系統(tǒng)工程,也是一個長期的過程。
2.2新論題研究
2.2.1關于知識組織將知識的控制單位從文獻深化到文獻中的知識元,實現(xiàn)知識元的鏈接,這是知識管理上的一場革命[1]。目前,在知識發(fā)現(xiàn)、知識獲取、知識表示、知識展現(xiàn)、知識推理等知識組織處理技術的變革與創(chuàng)新的趨勢下,知識組織的理論與方法也面臨著變革與創(chuàng)新。要對知識組織的概念、目標、原則、特征、方法、功能等基本理論問題進行反思,進行基于信息組織但又超脫于信息組織的深入研究。目前,國內學者已經開始關注這一問題,如文獻[2]探討了在語義Web技術的驅動下,知識組織從物理層次的文獻單元上升到認知層次的知識單元時,在理論和實踐上發(fā)生的重大變化。
2.2.2關于知識組織體系知識組織體系是伴隨著知識組織體系研究的深入而出現(xiàn)的一個新研究課題,知識組織理論與方法的創(chuàng)新也必然對知識組織體系的研究產生重大影響,需要拓展與深化知識組織體系的理論及相關方面的研究。研究重點主要包括:研究知識組織體系概念的內涵和外延,對其進行符合知識組織理論精髓的界定;與信息組織體系相比,知識組織體系在性質和功能上所具有的本質特征;研究知識組織體系的結構、功能及其構建機制等。文獻[3]探討了對知識組織體系發(fā)展產生重大影響的理念和技術,提出了知識組織體系的構建模式。
2.2.3關于語義網和知識網格語義網/知識網格雖是數(shù)字資源整合的發(fā)展趨勢,但尚處于一種構想狀態(tài),離實際應用還有相當距離。如Tim burners Lee給出的語義網的結構體系,是萬維網由數(shù)據網、信息網轉化為知識網的解決方案,但自2000年提出后,國內對其研究一直處于各層次功能作用的解釋上,其中位于語義網頂部的Logic、Proof和Trust尚沒有重要研究成果,對其他四個層次以及與其相關的理論與技術問題的研究,特別是對實際應用起指導作用的研究成果尚不多見。知識網格的研究剛剛起步。知識網格的理論、方法與技術體系的總體構建及各部分的深入研究是一個異常艱巨的任務。如知識網格的概念、特征、體系結構等基本問題,未有權威的被多領域認可的研究成果問世,特別是知識網格的核心――知識層的構建機制尚需要進行深入研究。文獻[4]立足計算機科學領域,對知識網格的概念、特征、方法、模型及相關技術問題進行了初步梳理,為知識網格的進一步研究奠定了基礎。但由于知識網格是涉及多學科的跨學科領域,如果不進行跨學科的協(xié)同研究,是很難形成引領實踐的研究成果的。
3應用研究趨勢
3.1數(shù)字資源整合范圍與規(guī)模不斷擴大
3.1.1由對規(guī)范性資源的整合到注重對非規(guī)范性資源進行整合數(shù)字資源包括規(guī)范性和非規(guī)范性兩類,前者經過一定程度的人工處理,格式相對穩(wěn)定,對其整合也相對容易實現(xiàn),后者則多為半結構化和非結構化的資源,對這類資源的整合相對困難。網格為數(shù)字資源整合提供了更為廣闊的空間,同時P2P等技術的發(fā)展為數(shù)字資源整合范圍的不斷擴大提供了有利的技術實現(xiàn)手段[5]。對Web動態(tài)的、非規(guī)范性資源整合系統(tǒng)的構建將成為人們關注的焦點。
3.1.2由對資源的整合逐步擴展到對應用程序、服務等功能進行整合隨著網格、SOA、WebService的相繼出現(xiàn),國內外學者對整合的研究不再局限于資源本身,而是開始探索如何重組、集成與資源相關的應用程序和服務,擴展其可重用性,避免重復開發(fā),提高網絡的運行效益[6]。
3.1.3與個性化需求更加緊密地融合其主要特點表現(xiàn)為服務方式從簡單的請求/應答式轉變?yōu)槎ㄖ?服務式,整合目標不再是為了解決單個的檢索需求,而是面向用戶的個性需求提供持久的跟蹤服務,支持主動的推送服務與知識檢索服務[7]。目前構建的數(shù)字資源整合系統(tǒng)非常關注資源的集成與整合,而較為忽略用戶需求方面的差異性和個性化。然而,用戶需求是多樣的,面向個性化用戶需求構建的整合系統(tǒng)將成為未來趨勢。
3.2知識整合是數(shù)字資源整合的主流趨勢
3.2.1更加注重新型知識組織體系在知識整合中的應用面對具有多樣性、復雜性特征的數(shù)字資源,傳統(tǒng)的知識組織工具顯得力不從心,由此促進了對新型知識組織體系的研究和應用。人們意識到,傳統(tǒng)知識組織和網絡時代的知識組織有共性之處,都是對人類知識結構進行表達和有組織的闡述的語義工具,但后者并不是前者的簡單重復或改良,而是螺旋式上升的質的飛躍[8]。目前,對本體、主題圖、概念圖、詞網等概念關聯(lián)類知識組織體系的研究成為新的焦點,包括新型知識組織體系和傳統(tǒng)知識組織體系間的集成與互補,新型知識組織體系間的內在聯(lián)系和功能整合等。
3.2.2領域本體的構建將成為知識整合的研究重心領域本體構建研究與應用的重心包括以下四方面:①對本體構建的理論、方法與技術進行深入研究,建立領域公認的核心概念和完整的本體構建的理論體系以及具有適用性、針對性的本體構建技術體系;②面向某一應用領域進行領域本體系統(tǒng)的構建實驗,包括初始本體的建立、本體的語義標注、本體的進化與學習、本體的管理、本體的展示與服務等整個過程;③在此基礎上、總結經驗、尋找規(guī)律,將其提升為理性認識,再進一步指導實踐,以促進領域本體的實驗研究更快、更有效地走向應用;④引入新的研究方法和手段,以增強本體系統(tǒng)的功能。文獻[9]提出將內容分析法與本體結合的研究思路,構建了基于本體的內容分析系統(tǒng),為本體研究提供了一種新的研究路徑。
3.2.3語義標引是研究與應用的重中之重怎樣按照已構建的本體概念體系,對資源對象進行概念抽取、分析、分類、描述和處理,是本體建設的重中之重。國外許多大學和研究機構正在研究和開發(fā)Web內容的語義標注工具,語義Web標注與編輯網(SEMANTIC WEB Annotation & Authoring)發(fā)布了13種基于本體的語義標注工具。文獻[10]對這些語義標注工具進行了介紹和比較,文獻[11]提出了一種基于領域本體的語義標引方法,并給出基于領域本體的語義標引過程。但目前對本體標注系統(tǒng)的研究還比較膚淺。理想的本體標引系統(tǒng)應該具有通用性,支持協(xié)同編輯,具有知識表達能力,支持多語言標引,具有自動分類、自動或半自動的知識獲取與標引[12],同時還應該支持本體的學習與進化。
3.3語義網/知識網格將成為數(shù)字資源整合的最終歸宿
語義網是以知識資源為基礎的人類知識整合的大環(huán)境,是人類知識的一個宏觀網絡,本體是語義網構建的核心和基礎,各個領域本體的構建對于語義網的實現(xiàn)至關重要。而基于本體的資源整合是數(shù)字資源整合的高級階段,所以數(shù)字資源整合一個重要的應用與研究發(fā)展趨勢就是融入語義網大環(huán)境。知識網格還是一種理念。文獻[13]認為:知識網格是一個智能的并充足的互聯(lián)環(huán)境,能使用戶或虛擬角色有效的獲取、整理、發(fā)布、理解、共享和管理知識資源,并為用戶提供所需要的知識服務,輔助實現(xiàn)知識創(chuàng)新、協(xié)同工作、問題解決和決策支持。這一定義目前被國內學者引用較多。需要關注的是,知識網格不是空中閣樓,它存在于現(xiàn)有的理論、方法和技術之上。知識網格作為知識組織和知識管理的技術框架,離不開知識資源的支撐,知識網格的實現(xiàn)需要以各個領域的知識資源體系為基礎。
4技術研究與應用趨勢
4.1網格
網格(Grid)是一種新的對資源/服務的集成技術,其本質是一種資源共享/協(xié)同的理念和思想[14]。根據不同的資源對象,網格分為逐次遞進的三層,即數(shù)據/計算層、信息層和知識層[15]。“數(shù)據/計算層” 的主要特點是可以處理大量的數(shù)據;“信息層”的功用主要解決異構信息的統(tǒng)一訪問;“知識層”的特點是可以對多源、異構、海量、復雜、動態(tài)的信息進行一體化的智能處理與組織,使用戶能夠有效地獲取、發(fā)布、共享和管理知識資源,提供所需的知識服務。目前國外已在開展基于網格技術整合數(shù)字資源與服務的研究,如DELOS、FreeLib、DILIGENT、GRACE等項目[16]。利用網格技術整合資源將是未來數(shù)字資源整合的發(fā)展趨勢。其研究與應用主要體現(xiàn)在以下兩方面:①利用網格技術進行基于信息層面的資源整合。如異構數(shù)據庫系統(tǒng)的整合應用、信息門戶的整合應用等。文獻[17]提出在原有OAI-PMH框架基礎上引入網格,可以更好地解決資源發(fā)現(xiàn)、整合、跨倉儲檢索等問題;②利用網格技術進行基于知識層面的資源整合。研究內容包括:知識獲取與知識表示的理論、模型、方法和機制,知識可視化和創(chuàng)新,動態(tài)虛擬組織間進行有效的知識傳播和知識管理,知識的有效組織、評估、提煉和衍生,知識關聯(lián)和集成[18]。資源的語義組織是網格研究的基點也是難點,而本體是網格資源語義組織的關鍵,將網格和本體有機結合起來是網格研究與構建的趨勢。如文獻[19]提出了一個基于本體的通用知識網格(UKG)架構模型;文獻[20]提出本體是知識網格的構建基礎和關鍵所在,本體學習的研究與發(fā)展必將從根本上改變網格環(huán)境下知識系統(tǒng)的構建方式。
4.2P2P
P2P(Peer to Peer)作為一種對等計算技術,其核心思想是:所有參與系統(tǒng)的結點是邏輯對等的(稱為對等點)。其目的是將網絡中不同的計算機連接起來,通過直接互連實現(xiàn)信息資源、處理器資源、存儲資源甚至高速緩存資源等的全面共享。由于P2P具有高度分布化、對等性、協(xié)同性、能夠動態(tài)發(fā)現(xiàn)并快速訪問資源等優(yōu)勢[21],使其具有廣泛的應用前景。P2P與網格有很多相似之處,但也有明顯的區(qū)別。例如網格的主要目的是實現(xiàn)大規(guī)模的、靈活的、安全的以及協(xié)同的資源共享,構成網格系統(tǒng)的節(jié)點一般都是高性能計算機節(jié)點,而P2P主要面向的是桌面PC機,通過大量節(jié)點之間的直接通信來共享各種計算資源;網格節(jié)點具有很高的穩(wěn)定性和可靠性,而P2P是一種更加松散的結構等[22]。隨著研究的發(fā)展,人們認識到網格和P2P存在互補性,應該將兩者加以整合,共同構筑下一代互聯(lián)網基礎設施,共同構建一個集高性能服務器和普通桌面PC于一體的網絡共享環(huán)境。P2P技術的發(fā)展以及同網格技術的匯融,為數(shù)字資源整合范圍的擴大和功能的提升提供了有利的技術實現(xiàn)手段。在這方面,文獻[7]介紹了英國、挪威等國的基于P2P技術的資源整合方案。
4.3SOA
SOA(Service Oriented Architecture)是一個面向服務的軟件系統(tǒng)框架。在這種框架下,一種服務被封裝為一個部件,一個SOA實質上就是一系列相互交互的服務集合,構建在這樣的系統(tǒng)中的服務可以使用統(tǒng)一和標準的方式進行通信,也可以調用多個服務協(xié)同工作。由于SOA集成的對象是一個個的服務,由于服務基于開放的技術標準,支持服務接口描述和服務處理的分離、服務描述的集中化存儲和發(fā)布、服務的自動查找和動態(tài)綁定以及服務的組合,因此可以滿足對于資源與服務整合的要求。所以SOA一經提出,首先得到企業(yè)的青睞,許多企業(yè)開始考慮構建基于SOA的資源整合系統(tǒng)[23];赟OA架構的整合系統(tǒng)包括三層關鍵結構,最底層是數(shù)據層,包括結構化的數(shù)據和非結構化的內容;中間層是集成工具,能夠將底層數(shù)據的異構和分布結構屏蔽,提供清晰明確的統(tǒng)一視圖;最上層是應用工具,能夠提供用戶所需的服務,便捷、高效的實現(xiàn)各種應用。文獻[7]介紹了Patrick C. K. Hung結合工作流管理提出的由應用層、工作流層、服務層、消息組成的SOA整合系統(tǒng)4層結構。由于SOA具有標準化、可重用性、可擴展性、集成效率高等優(yōu)勢,在SOA架構中能夠將數(shù)據和內容有效整合,與服務無縫鏈接,為資源整合提供了更優(yōu)化的解決方案。當前SOA正在與網格、P2P、Web服務技術相結合,增強并拓展了自身的服務集成功能,在資源整合與服務整合方面將發(fā)揮重要作用。
4.4Web服務
Web服務(Web Services)是一種基于XML語言和標準網絡協(xié)議實現(xiàn)的分布式計算技術,它力圖構建一種松散耦合環(huán)境下服務的描述、發(fā)現(xiàn)、調用以及集成的通用框架模型。與傳統(tǒng)的Web應用技術相比較,Web服務技術具有高度的可集成能力、完好的封裝性、數(shù)據松散藕合、跨平臺、開放性、支持的開發(fā)工具多等特性[24],目前正逐步應用于異構信息資源系統(tǒng)的集成與整合,在現(xiàn)有的各種異構平臺的基礎上構筑一個通用的與平臺、語言無關的技術層,各種不同平臺之上的應用依賴這個技術層來實現(xiàn)彼此的連接和集成[25-26]。當前,Web服務技術的研究與應用向以下兩方面拓展:①與網格技術互補融合[27]。Web服務和網格都是為了解決互聯(lián)網上巨大的資源的共享和互操作從不同角度提出的解決方案,因此在發(fā)展過程必然會走到一起。文獻[28]給出了一種服務體系結構協(xié)議,剖析了將網格系統(tǒng)的五層沙漏結構與Web服務技術結合起來的開放網格服務體系結構 ;②與語義Web/本體互補融合。本體使萬維網資源具有語義,也可以使基于資源的服務具有語義;使用本體對Web服務進行語義描述,并利用本體語義進行Web服務發(fā)現(xiàn),這樣就能共享和集成知識資源、應用程序和相應的服務。文獻[29]提出了將語義添加到Web服務的兩個標準(WSDL和UDDI)中以增強Web服務描述能力的方法。
目前,Web服務技術還處在不斷發(fā)展之中。它和網格、P2P、SOA、語義Web技術的優(yōu)勢互補,在跨平臺解決異構資源系統(tǒng)方面表現(xiàn)出更加靈活和更加強大的功能,也為數(shù)字資源在各個層面上的集成與整合提供了一個新的可行方向。
5結語
對數(shù)字資源整合理論進行系統(tǒng)、全面的研究,明晰數(shù)字資源整合應用的必然發(fā)展,把握對數(shù)字資源整合未來具有重大影響的新型技術,無疑對數(shù)字資源整合的可持續(xù)發(fā)展具有重要意義。本文結合國內數(shù)字資源整合研究現(xiàn)狀,對數(shù)字資源整合在理論、應用與技術方面的主要趨勢進行了初步的梳理和分析,以期對國內數(shù)字資源整合的研究與應用以啟示。
參考文獻:
[1] 溫有奎,徐國華,賴伯年,等.知識元挖掘.西安:西安電子科技大學出版社,2005:1.
[2] 牟冬梅,畢強.語義Web技術對知識組織理論和實踐的影響研究.圖書情報工作,2006(6):6-10,33.
[3] 李寧,宋文.對于知識組織體系概念以及構建模式的一些思考.圖書情報工作,2005(10):37-40.
[4] Zhuge Hai. The Knowledge Grid. Singapore: World Scientific Publishing Co, 2004:2-172.
[5] 黃永文.Web整合系統(tǒng)的分析與研究.圖書情報工作,2005(10):11-14.
[6] 李廣建.整合研究的幾個理論問題.圖書情報工作,2005(10):6-10.
[7] 李春旺.Web信息整合機制研究.圖書情報工作,2005(10):15-19.
[8] 閆巍,曾民族.構筑知識基礎結構的關健技術.現(xiàn)代圖書情報技術,2005(11):1-6,31.
[9] 王曰芬,顏端武,邱均平.基于Ontology的內容分析法――內容分析系統(tǒng)架構與運行機理研究.中國圖書館學報,2006(3):24-27.
[10] 陶皖,李平,廖述梅.當前基于本體的語義標注工具的分析.安徽工程科技學院學報,2005(6):52-55.
[11] 秦春秀,趙捧未,竇永香.一種基于本體的語義標引方法.情報理論與實踐,2005(3):244-246.
[12] 韓毅,畢強,崔春.語義Web門戶知識組織的策略與應用研究.圖書情報工作,2006(6):17-22.
[13] Zhuge Hai. China? e-science knowledge grid environment. IEEE Intelligent Systems, 2004,19(1):13-17.
[14] 徐志偉,馮柏明,李偉.網格計算技術.北京:電子工業(yè)出版社,2004:1.
[15] Roure D D, Jennings N R, Shadbolt N R.語義網格:未來e-Science的基礎設施//Berman F, Fox G C, Hey T.網格計算:支持全球化資源共享與協(xié)作的關鍵技術.都志輝,等譯.武漢:華中科技大學出版社,2005:344.
[16] 韓毅,畢強,李賀.國外基于網格技術的數(shù)字圖書館內容與應用的比較研究.情報學報,2006(2):221-230.
[17] 鄭志蘊,徐瑋,宋瀚濤,等.網格環(huán)境下基于OAI的數(shù)字圖書館互操作機制.計算機工程,2006(5):37-39.
[18] 諸葛海.知識網格.[2006-08-06].http://www.ict.省略/jcst/downloads/xsqy/qy1301.pdf.
[19] 李玉華,盧正鼎,廖振松.基于本體的通用知識網格架構研究.華中科技大學學報(自然科學版),2006(3):21-24.
[20] 劉柏嵩,高濟.面向知識網格的本體學習研究.計算機工程與應用,2005(20):1-5.
[21] 張智,楊俊,李瑞軒.面向服務的P2P模型研究.計算機應用研究,2005(9):63-64,80.
[22] 羅建光,楊士強.對等互通 自由共享 P2P更多地是一種思想.[2006-08-11].http://sj.media.省略/index1.php?IDx= 50&id=9.
[23] 呂希艷,張潤彤.基于SOA的企業(yè)信息資源整合.中國科技論壇,2006(2):103-105.
[24] 李亞紅,吳江,賈暉,等.基于Web Services實現(xiàn)異構數(shù)據庫集成技術研究.計算機應用研究,2006(2):81-83,86.
[25] 張馳,黃廣君,吳健,等.分布式組件與Web服務集成技術研究.微電子學與計算機,2006(3):146-149.
[26] 田世海,高長元.基于Web Services的高技術虛擬企業(yè)信息集成.中國軟科學,2006(6):150-155.
[27] 杜小勇,馬文峰.數(shù)字資源集成系統(tǒng)體系結構研究.情報資料工作,2005(3):42-45.
[28] 楊昭昭,黃必清,顏波,等.基于Web服務的應用網格體系結構研究.計算機應用研究,2005(7):229-233.
[29] 唐慶梅,熊齊邦.語義Web和Web服務標準集成的研究.計算機工程,2006(2):136-139.
〔作者簡介〕 馬文峰,女,1953年生,教授,發(fā)表論60余篇,獨著(合著)著作7部。
杜小勇,男,1963年生,教授,博士生導師,發(fā)表論文100余篇。
相關熱詞搜索:發(fā)展趨勢 資源整合 數(shù)字 數(shù)字資源整合的發(fā)展趨勢 海寧整合數(shù)字資源 烏鎮(zhèn)整合數(shù)字資源
熱點文章閱讀