【作者科研合作網(wǎng)絡(luò)模型與實證研究】實證模型
發(fā)布時間:2020-03-07 來源: 歷史回眸 點擊:
[摘要] 基于科研論文作者合作方式,建立一個作者科研合作網(wǎng)絡(luò)模型。通過理論分析和仿真驗證,網(wǎng)絡(luò)模型節(jié)點的度分布(作者合作人數(shù))符合冪率分布,該網(wǎng)絡(luò)是一種無尺度網(wǎng)絡(luò)模型。為了說明作者合作網(wǎng)絡(luò)模型的有效性,對2001年1月至2006年12月期間發(fā)表在《圖書情報工作》期刊上的科研論文進行統(tǒng)計,建立作者合作網(wǎng)絡(luò)。對作者合作網(wǎng)絡(luò)進行數(shù)據(jù)分析,結(jié)果與網(wǎng)絡(luò)模型結(jié)論一致,因此該模型可以很好地描述作者合作網(wǎng)絡(luò)的演化過程。
[關(guān)鍵詞] 作者科研合作 網(wǎng)絡(luò)模型 復(fù)雜網(wǎng)絡(luò) 圖書情報工作 實證研究
[分類號] G350 N94
1、引 言
隨著科學(xué)技術(shù)發(fā)展日趨全球化,科學(xué)合作日益成為科學(xué)研究的主流方式。在新的形勢下我國教育部提出:為了進一步發(fā)揮高等學(xué)校創(chuàng)新平臺的投資效益,凝聚并穩(wěn)定支持一批優(yōu)秀的創(chuàng)新群體,形成優(yōu)秀人才的團隊效應(yīng),提升高等學(xué)?萍缄犖榈膭(chuàng)新能力和競爭實力,推動高水平大學(xué)和重點學(xué)科建設(shè),高等學(xué)校應(yīng)該支持一批優(yōu)秀的創(chuàng)新團隊。
創(chuàng)新團隊作為一個研究群體,團隊合作是十分必要的。團隊中的每位成員都有自己的特長和優(yōu)勢,但也有各自的弱點,通過合作可以取長補短。于是,合作使群體中的個體更加優(yōu)秀,由這些更加優(yōu)秀的個體組成的群體當(dāng)然是實力強大的優(yōu)秀群體。因此創(chuàng)新團隊對于凝聚創(chuàng)新思想、獲取科技信息、共享研究資源、培養(yǎng)和造就新時期復(fù)合型人才,在重要學(xué)科領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展以及取得科學(xué)突破等方面具有十分重要的意義。本文以科研人員之間的合作關(guān)系為研究對象,基于復(fù)雜網(wǎng)絡(luò)理論,建立了一個科研人員合作網(wǎng)絡(luò)演化模型,分析科研人員之間的合作方式。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文
3信息單元
信息單元,也稱信息知識單元(在我國有情報知識單元之稱),是指以文獻知識的某些屬性特征(包括文獻的外形特征信息和內(nèi)容特征信息)作為知識管理的基本單元。我們通常把一部文獻所包含的完整信息稱為文獻信息,文獻信息主要包括文獻外形特征信息(如題名、著者、出版社、出版時間、出版地和相關(guān)載體特征等)內(nèi)容特征信息(如摘要、提要、主題詞、關(guān)鍵詞、標題、文獻中的字、詞、句、段、篇幅、參考文獻等)。信息單元的處理通常用信息熵,詞頻數(shù)、篇幅量,數(shù)據(jù)、信息和情報的比特量、字節(jié)量,圖像、聲音的幀、幅等來表示。信息單元既反映了文獻單元的基本特征,也是知識的重要來源。信息單元往往通過提煉、加工、組合、轉(zhuǎn)換等過程即可形成知識單元?梢哉f,信息單元是聯(lián)結(jié)文獻單元和知識單元的一座橋梁。
信息單元之間也不是獨立的,同樣也存在著各種復(fù)雜的關(guān)系。信息單元之間可以通過詞頻反映其在文獻知識單元乃至整個知識體系中的重要程度,通過主題關(guān)聯(lián)發(fā)現(xiàn)信息單元之間的學(xué)科關(guān)系、主題結(jié)構(gòu)、關(guān)聯(lián)程度(如主題詞或關(guān)鍵詞共現(xiàn)頻次),通過信息單元的不同組合還能發(fā)現(xiàn)新的知識單元(如主題詞或關(guān)鍵詞鏈及其網(wǎng)絡(luò))。
4知識單元
知識單元,也稱知識的內(nèi)容單元,是指在知識管理中用來處理知識的最小的、不可分割的、獨立的基本單元。知識單元主要用主題知識單元、關(guān)鍵詞知識單元、知識元、知識單元、知識基因、知識因子、知識項、知識本體、知識概念、概念地圖等來表示,目前主要用知識元來表示。知識元是指文獻中相對獨立的、表征知識點的一個元素,它可以是一段文字、一幅圖表、一個公式、一章或一節(jié)、一段動畫、一個程序等。知識元也往往直指知識產(chǎn)品(圖書、論文、專利等)中的概念、論點(觀點)、論據(jù)(數(shù)據(jù)、資料)、論證(方法、模型)、結(jié)論等知識核心和知識創(chuàng)新點,也可稱為元知識,是知識管理、知識計量與知識評價的最小單元。元知識為不可再分的知識,元知識是我們進行知識檢索的依據(jù),某一具體的元知識我們稱它為知識元[2,4-10]。同時,知識元之間也不是相互獨立的,而是相互之間也存在著各種復(fù)雜的關(guān)系。因此,基于知識單元和知識元的知識管理不僅研究知識元的數(shù)量、質(zhì)量和價值等特征,還要研究知識元之間存在的各種關(guān)系(包括關(guān)系鏈和關(guān)系網(wǎng)絡(luò))。
目前對知識元的粒度沒有十分明確的規(guī)定,它既可以是一小段文本或一幅圖像,也可以是一篇文獻。知識元一般為一個概念、定義、公式、定理、模型、方法、事實、數(shù)據(jù)、圖表、一段敘述或一組圖解操作等,它是知識的基本單元,由不能再分割的框架結(jié)構(gòu)表示。知識元之間可以分層次與嵌套,而它本身具有獨立的描述元數(shù)據(jù)。知識元是具有獨立的確定意義且不可再分的一個知識單元,在不同的應(yīng)用中,對知識元的描述是不同的。
文獻[4]將知識元分成兩大類型:①描述型 :包括信息報道型:名詞解釋型,數(shù)值型,問題描述型,文獻引證型;②過程型:包括步驟型,方法型,定義型,原理型,經(jīng)驗型等。而文獻[5]將知識元分成以下幾種類型:①概念類知識元,是對事物性質(zhì)、事物變化規(guī)律的認識,如“杠桿平衡”是一個概念;②原理類知識元,是對事物性質(zhì)、事物變化規(guī)律的認識,如“杠桿平衡原理”是一個原理;③方法類知識元,解決同樣的問題,方法可以多樣,方法類知識元是指分析、解決問題的某種確定的方法,如“因式分解法”有配方法、十字相乘法、求根法等; ④事實類知識元,反映一個事實,如歷史事件、地理現(xiàn)象、社會現(xiàn)象等; ⑤陳述類知識元,是用來表述兩者之間的關(guān)系或為了表達某個觀點,如生物學(xué)的基本特征、細胞中的種類和含量等; ⑥數(shù)值類知識元,是用來表述對象或過程的數(shù)量特征和關(guān)系,如工業(yè)總產(chǎn)值、GDP、變化量、變化率等;⑦模型類知識元,用來描述事物或?qū)ο蟮臄?shù)學(xué)或圖形模型,如統(tǒng)計模型、DNA雙螺旋結(jié)構(gòu)等。
5知識單元的比較與評價
5.1知識單元之間的關(guān)系
5.1.1文獻單元、信息單元與知識單元之間的關(guān)系文獻單元是有形的物理載體單元,信息單元和知識單元是無形的知識內(nèi)容單元,但信息和知識最終都需要存儲在一定的物質(zhì)載體上。因此可以說,文獻單元是信息單元與知識單元的基礎(chǔ)和來源,信息單元是連接文獻單元和知識單元的橋梁與中介,知識單元源于文獻單元和知識單元,是文獻單元和信息單元深入發(fā)展的結(jié)果,通過文獻單元和信息單元的不同組合能發(fā)現(xiàn)新的知識單元,知識單元能夠更加精確有效地反映文獻單元與信息單元之間的關(guān)系。知識元不僅可以直接表述知識的內(nèi)容,也可以通過文獻單元和信息單元將使用這一知識元的文獻關(guān)聯(lián)起來,將大量不斷更新、不斷出現(xiàn)的知識元建成知識元數(shù)據(jù)庫,將會產(chǎn)生各種知識內(nèi)容之間的內(nèi)在網(wǎng)絡(luò)化關(guān)聯(lián),體現(xiàn)出各學(xué)科專業(yè)交叉滲透的關(guān)系特征。它們之間的關(guān)系如圖1所示。
人類生產(chǎn)和創(chuàng)造的知識最終都以不同的形式存儲在不同類型的文獻中,盡管新的文獻類型仍有可能出現(xiàn),但已有的文獻內(nèi)容格式都是以紙質(zhì)型文獻內(nèi)容格式的方式存在(如電子文獻和網(wǎng)絡(luò)信息仍然是以紙質(zhì)文獻格式表現(xiàn)),因為長期以來人們已經(jīng)習(xí)慣并接受這種比較完善的知識表達和生產(chǎn)方式。因此,對知識單元和信息單元的處理離不開對文獻單元的處理。
5.1.2知識元與知識單元的關(guān)系知識元為知識管理的內(nèi)容單元,而知識單元既可以是管理的物理單元也可以是知識管理的內(nèi)容單元,因此知識單元可以是文獻單元與信息單元,也可以是知識元。知識元是知識單元中最小的、不可分割的獨立單元,一個知識元可以包含多個知識單元(如多篇文獻中僅論述一個概念、觀點、思想、理論、原理、方法、模型或數(shù)據(jù)等),一個知識單元可以包含多個知識元(如一篇文獻中論述多個概念、觀點、思想、理論、原理、方法、模型或數(shù)據(jù)等)。知識單元由最小的知識元素――“知識元”組成,知識元的不同排列構(gòu)成了不同知識單元之間的差異,知識元也是知識結(jié)構(gòu)的最小元素,在知識結(jié)構(gòu)中可以由知識元直接組成新的知識單元 [11]。
5.2知識單元的比較與評價
現(xiàn)有的以文獻――知識的物理單元為基礎(chǔ)的知識組織與管理方式(如目錄、題錄、索引、文摘、文獻數(shù)據(jù)庫等)有兩大缺陷[4] :①組織和管理的是知識載體――文獻,而不是知識本身,盡管通過文獻單元能反映和揭示知識的某些特征,但這只是表面的、粗糙的和不精確的特征,較難深入地揭示知識的內(nèi)在特征與聯(lián)系;②檢出的文獻只含已有的知識,不能揭示其間的內(nèi)在聯(lián)系,為產(chǎn)生新知識提供營養(yǎng)土壤。由于文獻單元和知識單元在處理對象上的差異,因此它們在反映知識的關(guān)系程度上相去甚遠。雖然精確度不高,但文獻單元也有其優(yōu)越性,文獻單元是一種有形的物理載體,易于識別、處理、控制和操作,所以長期以來成為知識管理的主要操作單元。
將完整的文獻單元分解成單個的信息單元,用一組信息單元的集合來反映一個文獻單元的特征是信息單元處理的特點。盡管信息單元的處理最終必須信賴文獻單元,但信息單元在一定程度上反映了文獻單元的知識內(nèi)容及其關(guān)系,將處理對象從文獻載體推進到文獻內(nèi)容本身,大大提高了知識管理的精度,可以說是知識管理的一次巨大的進步。但是信息資源雖然可以通過標題、主題詞、關(guān)鍵詞、作者、內(nèi)容分類特征等信息單元進行組織、存儲和關(guān)聯(lián)檢索,甚至可以進行簡單的全文任意詞檢索,然而對于“求知者”所要解決的問題來說,并不能迅速而準確地提供全面、系統(tǒng)、針對性的知識信息。加之這些數(shù)據(jù)庫在結(jié)構(gòu)、信息加工標準和質(zhì)量上的差異,使得數(shù)據(jù)庫之間的信息關(guān)聯(lián)、內(nèi)容關(guān)聯(lián)更加難以實現(xiàn)。在這個意義上,在現(xiàn)有數(shù)字化圖書館建設(shè)目標下開發(fā)的知識信息資源,本質(zhì)上還只是一本一本“堆積”起來的數(shù)字化圖書、期刊。除了信息量大、檢索查詢速度快等方便之外,數(shù)字化圖書館使人們感受到的獲取信息的手段與方式,依然類似于傳統(tǒng)圖書館的“計算機書目檢索”與“開架借書”,與在現(xiàn)代信息技術(shù)水平之下人們追求的知識管理所應(yīng)當(dāng)達到的境界還相距甚遠。加上信息單元反映的是分解的文獻信息和知識內(nèi)容,而我們有時需要的是完整的信息、知識內(nèi)容,因而使知識管理的精度受很大程度的影響。
以文獻單元和信息單元為基礎(chǔ)的知識組織與管理方式或只停留在以整篇文獻為單元,選取若干主題詞,沒有分離出構(gòu)成知識的最小單位――知識元;或采用引文索引,但沒有建立知識元之間的直接聯(lián)系;或只是采用文本知識發(fā)現(xiàn)提供文獻中精細的信息和多篇關(guān)聯(lián)的信息,但輸出的仍是文獻,難于提供脫離原始文獻的獨立知識元。從“知識元”層面研究知識管理,揭示單篇文獻個體中的“知識元”信息與某領(lǐng)域共性中的“知識結(jié)構(gòu)”的鏈接關(guān)系,從而找出信息與知識的導(dǎo)航鏈接的普遍規(guī)律,為用戶提供直接獲取有效知識元而不是大量文獻是一種有效的知識管理方式。因此,知識元是知識管理的起點。知識可分解成最小的獨立單元,即知識元。知識元是構(gòu)成知識結(jié)構(gòu)的基元。知識元的不同排列組合可構(gòu)成不同知識單元,不同知識單元按照不同邏輯關(guān)系可組成不同的知識元鏈接。從知識元到知識單元,再到知識結(jié)構(gòu),形成不同屬性的知識鏈。知識元之間的不同層次、不同屬性、不同學(xué)科領(lǐng)域的鏈接,是實現(xiàn)新知識生產(chǎn)、知識傳播及知識有效利用的核心。知識檢索是在知識結(jié)構(gòu)中獲取知識的過程,用戶可以通過知識單元間接地獲取知識,更可以通過知識元直接獲取知識,而文獻檢索和信息檢索只能通過間接地獲取文獻再獲取知識[2,4]。
6知識單元的發(fā)展趨勢
6.1知識單元發(fā)展的瓶頸與障礙
盡管在現(xiàn)有的一些文獻中提出了“知識元”的概念及其在知識組織與管理中的操作方式,確實是突破了以往知識組織與管理的模式,令人歡欣鼓舞。但仔細思索之后,筆者認為形式并不容樂觀。雖然我們有了一個好的開始,但這并不表示目標已經(jīng)實現(xiàn)。在知識單元和知識元的處理上還存在大量的問題:①目前所提出的“知識元”這一概念仍然是一個抽象的、不確定的概念,即具有不確定性和不穩(wěn)定性,還不能清楚地界定;②雖然在許多文獻中已經(jīng)頗具特色地對知識元的結(jié)構(gòu)進行較為清楚的描述,但知識元的長度、來源、識別、組合等依舊十分模糊,導(dǎo)致在知識元標引、組織、存儲、檢索、利用等方面尚不具有可操作性,特別是計算機自動處理;③知識元的基本構(gòu)成單元目前最終還是要以字、詞、句、段、全文中的主題知識概念等為基礎(chǔ),仍然不能脫離文獻單元和信息單元,也就是說,知識元應(yīng)該是一個最小的表達一個完整知識概念的獨立單元,它最終還是由一個或多個主題詞、關(guān)鍵詞等組合而成。因此,對知識元的明確界定、知識元的有效提取和對知識元的可操作性是目前仍然要解決的關(guān)鍵問題。最后,由于知識組織和管理的慣性,以知識元為知識單元的知識組織與管理還有相當(dāng)長的路要走。首先面臨的是人們習(xí)慣的挑戰(zhàn),我們在知識的組織與管理上已經(jīng)形成了比較成熟的方法和體系,在技術(shù)上也得到了有效實現(xiàn),正趨于完善。人們在思維、學(xué)習(xí)、知識獲取、知識生產(chǎn)和知識利用等方面已經(jīng)習(xí)慣于以文獻單元為中心,在知識的組織與管理上也逐步形成完整的知識體系。毫無疑問,要突然打破這種現(xiàn)存的、完善的知識組織體系,在知識管理和利用習(xí)慣、觀念以及社會成本上都是一個巨大的挑戰(zhàn)?梢哉f,知識單元的發(fā)展不僅面臨著本身的缺陷和瓶頸,還要解決和克服來自知識利用習(xí)慣和社會成本等方面的壓力。
6.2知識單元未來研究的思路
6.2. 1深入地研究文獻單元、信息單元與知識單元的特征及其關(guān)系知識單元的組織與管理離不開對文獻單元和信息單元的處理。知識元、知識單元、知識結(jié)構(gòu)都以文獻單元和信息單元的方式表現(xiàn),文獻單元、信息單元轉(zhuǎn)換為知識單元是實現(xiàn)知識組織與管理的關(guān)鍵。研究文獻單元、信息單元的結(jié)構(gòu)與內(nèi)容特征,如何用文獻單元和信息單元所包含的內(nèi)容特征及其關(guān)系等為基礎(chǔ)來分析和表達知識元,從文獻單元和信息單元中有效識別和提取知識單元仍然是今后長時間內(nèi)要研究的核心問題。一旦實現(xiàn)知識的控制單位由文獻深化到“知識元”,大量文獻中所包含的“知識元”及相關(guān)信息間的鏈接,將產(chǎn)生極大的知識增值。從而大大推進人類對知識的利用,促進對新知識的創(chuàng)造。從而也將推動知識產(chǎn)業(yè)的重大發(fā)展,F(xiàn)在的障礙在于,傳統(tǒng)的圖書館學(xué)情報學(xué)理論與方法能否對人類迄今的全部知識成果進行全面的梳理與組織,構(gòu)建起“知識體系”的框架,并確定各個知識單元之間的邏輯關(guān)系。因此,圖書情報學(xué)的發(fā)展已經(jīng)到了一個新的轉(zhuǎn)折點,應(yīng)該突破傳統(tǒng)的專業(yè)角色和視野來總結(jié)和發(fā)展圖書館學(xué)和情報學(xué),朝著建立“知識體系科學(xué)”的目標發(fā)展[4],有助于我們深入地研究知識單元的組織與管理。
6.2.2有效利用知識管理技術(shù)推進知識單元研究如果說在手工操作時代,要想對海量的文獻信息管理深化到“知識單元”層次只是一種無法實現(xiàn)的理想的話,那么,現(xiàn)代知識管理技術(shù)的發(fā)展,特別是以計算技術(shù)和網(wǎng)絡(luò)技術(shù)為核心的現(xiàn)代信息技術(shù)的迅猛發(fā)展,尤其是近年來知識網(wǎng)格技術(shù)的發(fā)展,已經(jīng)從技術(shù)手段上為人類的這一夢想提供了實現(xiàn)的可能性。知識管理技術(shù)已經(jīng)使人類實現(xiàn)了從知識的手工管理到自動化管理到數(shù)字化管理再到智能化管理的轉(zhuǎn)變,將來的發(fā)展趨勢依然是進一步利用知識管理技術(shù)的最新成果,將知識的智能化管理向前推進,真正地實現(xiàn)知識的集成、綜合、推理與自由管理,達到知識自由組合、高效創(chuàng)新的目標。從目前信息技術(shù)的發(fā)展來看,將來能有效用于知識管理的新的信息技術(shù)可能主要人工智能技術(shù)、網(wǎng)格技術(shù)、知識網(wǎng)格技術(shù)、知識挖掘技術(shù)、語義網(wǎng)絡(luò)技術(shù)、知識倉庫技術(shù)等。特別是綜合集成知識資源的知識網(wǎng)格技術(shù)在全球范圍內(nèi)迅速發(fā)展,世界各國都紛紛制定了知識網(wǎng)格發(fā)展計劃和規(guī)劃[12],以期在知識網(wǎng)格競爭中贏得先機。我國在知識網(wǎng)格的發(fā)展中也不甘示弱,1999年6月我國就提出了名為“中國知識基礎(chǔ)設(shè)施(CNKI)”的信息與知識服務(wù)模式。隨后相繼推出了網(wǎng)絡(luò)發(fā)展計劃,包括科技部的國家網(wǎng)格(CNGrid)、教育部的中國教育科研網(wǎng)格計劃(ChinaGrid)、國家基金委的E-Science網(wǎng)格研究計劃、上海交通信息網(wǎng)格、中國空間信息網(wǎng)格等[13]。
內(nèi)容開發(fā)技術(shù)也取得了長足進步。內(nèi)容開發(fā)深度從點(字、詞)、線(字符串、全文文本)、面(數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫)、立體(信息流、物流、資金流的結(jié)合)、三維空間(A/V、數(shù)據(jù)挖掘)、萬象空間(虛擬真實)到思維空間(知識表現(xiàn)、概念形式化、知識量化等),在不斷突破傳統(tǒng)界限。元數(shù)據(jù)、分布式數(shù)據(jù)庫、數(shù)據(jù)格式、質(zhì)量控制、可交換格式、自動轉(zhuǎn)換以及數(shù)據(jù)制備、整合、融合、數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、內(nèi)容檢索、可視化等內(nèi)容開發(fā)技術(shù)都取得實質(zhì)性進展[14]。為深入文獻內(nèi)部對知識進行直接管理、計量與評價提供了技術(shù)基礎(chǔ)。
參考文獻:
[1]溫有奎. 基于知識元語義網(wǎng)格平臺的知識發(fā)現(xiàn)研究. 計算機工程與應(yīng)用,2006(4):4-7.
[2]溫有奎, 徐國華.知識元鏈接理論. 情報學(xué)報, 2003(6):666-671.
[3]Nasukawa T,Nagano T. Text analysis and knowledge mining system. IBM Systems Journa, 2001, 40(4):967-984.
[4]溫有奎, 賴伯年. 網(wǎng)格技術(shù)將推動知識管理革命. 情報學(xué)報, 2004(1):125-129.
[5]張靜, 劉延申, 衛(wèi)金磊,等. 論中小學(xué)多媒體知識元庫的建設(shè).現(xiàn)代教育技術(shù), 2005(5):68-71.
[6]曾民族. 向知識標引進軍――閱讀《知識元挖掘》的體會.情報學(xué)報, 2006(2):255-257.
[7]朱慶華.《知識元挖掘》評介――兼議情報學(xué)的理論研究. 情報科學(xué), 2006(12):1899-1992.
[8]溫有奎, 溫浩, 徐端頤,等. 基于創(chuàng)新點的知識元挖掘.情報學(xué)報, 2005(6):663-669.
[9]溫有奎, 溫浩, 徐端頤,等.基于知識元的文本知識標引. 情報學(xué)報, 2006(3):282-289.
[10]溫有奎.基于“知識元”的知識組織與檢索. 計算機工程與應(yīng)用, 2005(1):55-59.
[11]溫有奎, 徐國華, 賴伯年,等. 信息整流與知識增值服務(wù). 情報學(xué)報, 2003(3):273-277.
[12]諸葛海.知識網(wǎng)格. [2007-04-06].http://jcst.ict.省略/downloads/xsqy/qy1301.
[13]金海.中國網(wǎng)格技術(shù)的發(fā)展及現(xiàn)狀. [2007-04-06].http://www.省略/20031030/3093557.shtml.
[14]曾民族.構(gòu)建知識服務(wù)的技術(shù)平臺.情報理論與實踐,2004(2):113-119.
相關(guān)熱詞搜索:模型 科研 實證研究 作者科研合作網(wǎng)絡(luò)模型與實證研究 capm模型的實證研究 capm模型的假設(shè)
熱點文章閱讀