国产第页,国产精品视频一区二区三区,国产精品网站夜色,久久艹影院,精品国产第一页,欧美影视一区二区三区,国产在线欧美日韩精品一区二区

知識鏈接的構(gòu)建方式研究_綠色生活方式概念

發(fā)布時間:2020-03-07 來源: 散文精選 點擊:

  摘要 在概述知識鏈接中知識的各種關(guān)聯(lián)關(guān)系的基礎(chǔ)上,詳細分析知識鏈接的類型,并由此探討知識鏈接的4種主要構(gòu)建方式。作者提出利用參考鏈接機制推進科學(xué)文獻的知識鏈接,進行科學(xué)對象詞典編制,提升作者機構(gòu)等相關(guān)對象的鏈接與評價。建立主題圖促進知識元鏈接,對知識要素的抽取標引推動科學(xué)數(shù)據(jù)的鏈接。
  關(guān)鍵詞 知識鏈接 知識要素 科學(xué)對象 鏈接方式
  分類號 G250
  
  知識鏈接是指從一個信息物體鏈接到另一個信息體,一般特指學(xué)術(shù)論文之間、概念單元之間和科學(xué)對象之間的鏈接關(guān)系。其發(fā)展與互聯(lián)網(wǎng)的出現(xiàn)息息相關(guān),很大程度上歸功于互聯(lián)網(wǎng)所提供的相互鏈接功能…。
  通過知識鏈接,利用引文關(guān)系、上下位關(guān)系,可以不斷擴大檢索范圍,掌握越來越多的相關(guān)文獻。通過知識鏈接,可以處理異質(zhì)信息資源,建立一個包括期刊雜志、科學(xué)數(shù)據(jù)、作者網(wǎng)頁、專利信息和產(chǎn)品信息等互相鏈接的圖書館信息環(huán)境。隨著技術(shù)的進步、資源的豐富和標準化工作的進展,知識鏈接還可以構(gòu)成一個統(tǒng)一的知識體系結(jié)構(gòu),形成序列化或結(jié)構(gòu)化的知識集合,構(gòu)建知識網(wǎng)絡(luò)門戶體系,揭示知識的本質(zhì)聯(lián)系,繼而對可鏈接的知識進行智能檢索、知識導(dǎo)航、交叉揭示、統(tǒng)計分析,達到評價知識及其相關(guān)科學(xué)對象的目的。
  因此,研究知識關(guān)聯(lián)關(guān)系、知識鏈接原理,探討知識鏈接的構(gòu)建方式,對于實施知識鏈接的具體實踐具有重要的現(xiàn)實意義。
  
  1知識的關(guān)聯(lián)關(guān)系
  
  1,1知識的同一關(guān)系
  指由知識節(jié)點間具有某種相同屬性,各個知識單元間在中心主題、主題、主題因素、概念中所蘊含的形象、屬性、關(guān)系所具有的某種程度的相同或相通(相似)之處。表明具有同一性的知識單元間的等同性、等價性、相似性、延展性,可以消解知識內(nèi)容的離散性、重復(fù)性,即將大量離散的具有同一性的知識單元聯(lián)系在一起。
  
  1,2知識的隸屬關(guān)系
  指構(gòu)成某知識節(jié)點的某一知識單元或知識單元集合隸屬于某一概念、范疇和類別的邏輯關(guān)系。即將具有隸屬關(guān)系的知識單元,按照一定的屬種、總分、包含的抽象思維或形象思維的邏輯關(guān)系進行關(guān)聯(lián),使各個知識單元在屬種、總分、包含關(guān)系中擴大或縮小適用功能和范圍。即可以通過一般和個別、總體和部分的內(nèi)在關(guān)聯(lián)性來建立知識鏈接。
  
  1,3知識的相關(guān)關(guān)系
  指在同一、隸屬關(guān)系之外知識單元間所具有的相互依存、相互滲透、相互制約、相互作用的關(guān)系,一般是指相反、相對、因果、引用、應(yīng)用、影響等各種關(guān)系,但其關(guān)系是不嚴格固定的或數(shù)量關(guān)系是不完全確定的。
  除此之外,科學(xué)對象之間還有繼承關(guān)系、沿革關(guān)系、合作關(guān)系,科學(xué)文獻之間存在著引證關(guān)系(如互引、引文樹)、同現(xiàn)關(guān)系(如同被引、共引、共詞)、上下游間出版?zhèn)鞑リP(guān)系等,都可以構(gòu)建知識的關(guān)聯(lián)關(guān)系。
  
  2知識鏈接的類分
  
  2,1基于科學(xué)文獻的知識鏈接
  通過科學(xué)文獻(學(xué)術(shù)論文、引文、專利、標準等)之間的引證關(guān)系,利用開放鏈接標準,確定引文鏈接網(wǎng)絡(luò)地址(URL),建立引文鏈接索引庫,鏈接源與相應(yīng)的目標可以是期刊論文、學(xué)位論文、標準、專利、圖書篇目、會議錄、文摘索引款目或甚至是Web站點、E-mail中的鏈接等。通過科學(xué)文獻中的各類型引文,在文摘索引與其所標引文獻、文后參考資料與被引用資料之間建立關(guān)聯(lián)和鏈接。根據(jù)引文的引用、被引用和共同引用三種類型,可進行引文正向鏈接、引文反向鏈接和共引文獻聚類鏈接等。用戶通過互聯(lián)網(wǎng)查詢這些建立了論文引文鏈接的數(shù)據(jù)庫和知識庫,借助各種引用途徑在整個知識體系中情景敏感地獲得相關(guān)知識信息。
  許多情況下使用知識鏈接的用戶都處于一種包括OPAC系統(tǒng)、文摘索引數(shù)據(jù)庫、電子期刊及Web信息資源服務(wù)等多種類型信息資源在內(nèi)的復(fù)合圖書館環(huán)境之中。不僅實現(xiàn)同一個文獻數(shù)據(jù)庫中的文獻鏈接,還能實現(xiàn)多個文獻數(shù)據(jù)庫的內(nèi)容深度整合,在跨庫多維鏈接的基礎(chǔ)上,實現(xiàn)跨庫引文分析與文獻相似性分析,繼而建立跨庫的知識鏈接。
  
  2,2基于知識元的知識鏈接
  知識元是知識的最小單位,是知識結(jié)構(gòu)的基本組成部分,它普遍存在于豐富多彩的文獻世界中。不同的研究視角對知識元的稱謂不同,定量化的研究角度稱其為知識元或知識元素、知識因子,定性化的研究視角就是概念或事物。那么,在知識體系中知識元則作為結(jié)構(gòu)最小的知識節(jié)點,用語詞來表示就是關(guān)鍵詞或關(guān)鍵詞組。實現(xiàn)知識元鏈接,首先必須將這些最小的知識單元提煉出來。即把一個概念、一個事實或一個數(shù)據(jù)等實際能說明某個知識的各元素包括知識概念、關(guān)鍵詞或關(guān)鍵詞串等提煉出來,按照基本知識結(jié)構(gòu)存儲在知識元庫中。
  知識元庫是知識元鏈接的中樞,由具有獨立意義的知識元素構(gòu)成,包括理論與方法、事實、數(shù)值型三類基本知識元。通過對知識信息點的元素化加工與概括提煉,可以了解各學(xué)科知識基本內(nèi)容,并發(fā)現(xiàn)知識之間的內(nèi)容關(guān)聯(lián)。知識元庫不僅可以直接表述知識的內(nèi)容,也可以通過全文數(shù)據(jù)庫的索引技術(shù),將使用這一知識元的所有文獻自動鏈接為知識體系。
  
  2,3基于科學(xué)對象的知識鏈接
  知識領(lǐng)域內(nèi)存在著作者與作者、作者與機構(gòu)、機構(gòu)與機構(gòu)、作者與主題間的學(xué)術(shù)關(guān)系,重要機構(gòu)、團隊、科研人員學(xué)術(shù)關(guān)系及其相關(guān)關(guān)系成為知識鏈接的基礎(chǔ)。
  通過對科學(xué)共同體、作者、出版社、基金組織等科學(xué)對象間學(xué)術(shù)資助、科學(xué)引證、科研合作、科學(xué)出版等關(guān)系的分析,對科學(xué)文獻中學(xué)術(shù)參與者(機構(gòu)和人)之間合著關(guān)系、引用關(guān)系、人員機構(gòu)延續(xù)關(guān)系、人員和刊物關(guān)系等進行挖掘,可以實現(xiàn)對知識領(lǐng)域內(nèi)科學(xué)對象(包括人和組織)的結(jié)構(gòu)、活動模式和演化過程的揭示,實現(xiàn)對領(lǐng)域內(nèi)典型學(xué)術(shù)關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu)和演化過程的可視化表現(xiàn),發(fā)現(xiàn)機構(gòu)、科研團隊和個人間學(xué)術(shù)網(wǎng)絡(luò)關(guān)系的特點與趨勢。
  建立基于本體的科學(xué)對象網(wǎng)絡(luò)體系,將這些科學(xué)對象進行揭示、集成和存儲,有機組織到相應(yīng)的知識組織體系之中,建立起科學(xué)對象和原始文獻之間的關(guān)聯(lián)關(guān)系,形成可供計算的科學(xué)對象與科技文獻間關(guān)聯(lián)數(shù)據(jù)。并在此基礎(chǔ)之上,通過聚類、文獻計量、引文追蹤、鏈接分析、相關(guān)性規(guī)則計算等數(shù)據(jù)挖掘方法,識別出存在于科技文獻之中的各種學(xué)術(shù)關(guān)系網(wǎng)絡(luò),對領(lǐng)域內(nèi)存在的結(jié)構(gòu)關(guān)系和知識領(lǐng)域演化發(fā)展過程進行描繪,以反映出當前相關(guān)領(lǐng)域的研究中所存在的主要研究團隊和個人的特點、研究進展、研究主題分布情況、研究關(guān)鍵點等知識領(lǐng)域信息,從而為知識管理提供基礎(chǔ)數(shù)據(jù)支持。
  
  2,4基于知識要素的知識鏈接
  科技文獻中包含大量的技術(shù)、項目、產(chǎn)品及其參數(shù)、指標、相關(guān)的圖形表格等知識要素,這些知識要素往往分散于各種類型、各種載體和各種內(nèi)容的文獻之中,各知識要素問也存在著相互關(guān)聯(lián),如項目創(chuàng)新技術(shù)、技術(shù)創(chuàng)造產(chǎn)品,產(chǎn)品又有各種相關(guān)的技術(shù)參數(shù)和指標,它們之間還存在著同一關(guān)系、上下位關(guān)系和相關(guān)關(guān)系等,存在著技術(shù)交替與延續(xù)、技術(shù)仿制及融合的發(fā)展 過程,而其表述除文本外,多數(shù)是圖形和表格等。對知識要素進行識別和抽取,對圖形表格語義特征與語義模型、語義屬性進行標注及標引,可以建立知識要素的概念化描述以及知識要素間的鏈接關(guān)系。能夠展現(xiàn)技術(shù)自身的實況,表現(xiàn)技術(shù)演化發(fā)展的過程,成為技術(shù)圖譜。
  在泛在知識環(huán)境下,隨著互聯(lián)網(wǎng)和數(shù)據(jù)庫產(chǎn)業(yè)的發(fā)展,許多信息服務(wù)機構(gòu)不僅在自己的數(shù)據(jù)庫內(nèi)提供鏈接,而且開始建立跨機構(gòu)的知識鏈接,實現(xiàn)開放鏈接系統(tǒng)。其鏈接的方式也呈綜合性,豐富多樣,通過對鏈接解析工具的直接控制和使用,基于以DOI為唯一標識基礎(chǔ)的鏈接推進了開放鏈接系統(tǒng)的產(chǎn)生,使文獻間的鏈接在圖書館環(huán)境下普遍存在。同時也開始進行從文獻到科學(xué)數(shù)據(jù)庫的鏈接,將文章中的基因系列與基因數(shù)據(jù)庫中的記錄鏈接,實現(xiàn)文章內(nèi)或文章間的化學(xué)結(jié)構(gòu)、知識單元、科學(xué)對象以及相關(guān)的技術(shù)參數(shù)指標等知識要素的鏈接,將文章中對實驗結(jié)果的描述與科學(xué)數(shù)據(jù)、科學(xué)參數(shù)結(jié)合等。
  
  3知識鏈接的構(gòu)建方式
  
  3,1參考鏈接機制構(gòu)建
  超文本是一種按知識之間的關(guān)系非線性地存儲、組織、管理和瀏覽知識的技術(shù)與方法。超文本鏈接是表現(xiàn)知識之間關(guān)系的一種手段,指使用超文本標記語言(HTML)的標記指令,通過統(tǒng)一資源定位符(URL),指向鏈接對象的具體位置,在鏈接源(鏈源)與鏈接目標(鏈宿)間建立聯(lián)系。其包括兩個核心要素:節(jié)點和鏈。節(jié)點是展現(xiàn)知識的基本單元,可以是題錄、不同載體形式的文獻全文,也可以是文獻的責(zé)任者、文獻主題、文獻出版機構(gòu)等。鏈用來組織節(jié)點,表達節(jié)點問的關(guān)系,它是由一個節(jié)點指向其他節(jié)點,或從其他節(jié)點指向該節(jié)點,以表示不同節(jié)點間知識的關(guān)系,鏈需要采用相同的表述工具予以標識。所以,知識鏈接可作為一個過程,也可看作一個系統(tǒng)。
  鏈接是超文本的核心,其基本特征是在嵌入URL標識的節(jié)點之間建立關(guān)系。適應(yīng)數(shù)字環(huán)境下異構(gòu)資源系統(tǒng)的發(fā)展,參考鏈接分為封閉式靜態(tài)鏈接、開放式靜態(tài)鏈接以及開放式動態(tài)鏈接。封閉式靜態(tài)鏈接是指所有嵌入URL的信息鏈接點均在本地存儲和控制,如ISI的Web of Science;開放式靜態(tài)鏈接主要是鏈源和鏈宿互相提供鏈接對象的標識符或URL,如Cross-Ref;開放式動態(tài)鏈接主要是基于OpenURL協(xié)議的開放、擴展和多向性鏈接,OpenURL標準的出現(xiàn)為建立無縫的、上下文敏感鏈接提供基礎(chǔ),如SFX。它們都是采用超文本鏈接技術(shù),通過唯一標識符的指向,將文獻實體間的引證關(guān)系進行定位,從而構(gòu)建參考鏈接機制。
  許多新的技術(shù)標準陸續(xù)出現(xiàn),推進了基于多樣性信息環(huán)境的知識鏈接。RDF建立了表達語意和知識關(guān)系的模型,DOI和CrossRef可以用所建立的數(shù)字對象唯一標識體系固化相互之間的引用關(guān)系;OpenURL可以用來表達動態(tài)的、基于用戶環(huán)境和身份的鏈接關(guān)系;而XLink支持多方向的擴展鏈接,可以在文檔之間建立多向的復(fù)雜鏈接關(guān)系,實現(xiàn)鏈源到鏈宿之間的相互鏈接。
  
  3,2科學(xué)對象詞典編制
  作者及其單位、基金、文獻來源等是知識鏈接的科學(xué)對象,基于引文的知識鏈接,需要對其相關(guān)文獻外部特征和內(nèi)部特征進行規(guī)范合一,除對文獻題目進行歸一外,還需要對文獻來源(期刊名稱和出版社名稱)、作者及其單位、基金等科學(xué)對象進行規(guī)范,是實現(xiàn)知識服務(wù)和統(tǒng)計評價功能的關(guān)鍵因素。
  對科學(xué)對象的鏈接,需要在論文引文數(shù)據(jù)庫建設(shè)過程中進行相關(guān)科學(xué)對象文本的抽取,制定相關(guān)規(guī)范及標準,建立面向科學(xué)對象詞典的結(jié)構(gòu)體系和標準,將文本內(nèi)容中的科學(xué)對象提煉出來,編制成科學(xué)對象詞典。例如,機構(gòu)包括正式名稱和別稱,同一機構(gòu)可以有許多不同的名稱,實名和指稱、譯名、指代、縮寫、簡稱等;機構(gòu)間有代用、相關(guān)、從屬等關(guān)系;需要辨析之間的同義、近義、反義、從屬、隱含、關(guān)聯(lián)等關(guān)系。
  通過構(gòu)建信息抽取原型系統(tǒng),對知識內(nèi)容點的要素化提煉和規(guī)范,采用KDD和數(shù)據(jù)挖掘(Data Mining)等技術(shù)方法,從海量的、結(jié)構(gòu)化的數(shù)據(jù)集中識別出新穎、有效的要素,包括機構(gòu)、人員等實體的抽取。同時,按照一定的分類體系,采用分類標引法和詞語標引法揭示科學(xué)對象的主題內(nèi)容和屬性,標識出科學(xué)對象之間的相關(guān)關(guān)系,并進行族性組織和語義、特性組織,使科學(xué)對象之間具有等級關(guān)系和學(xué)科關(guān)系。編制出規(guī)模適當、具有語義關(guān)系、分級合理并可靈活配置的科學(xué)對象詞典(對象本體)。這樣,可以基于科學(xué)對象詞典相關(guān)語義場運算技術(shù),把知識特征(形式特征與內(nèi)容特征)與詞典中的標引詞匯進行相符性比較,通過引文與論文之間的作者、機構(gòu)、出版社、基金等的規(guī)范,通過科學(xué)對象關(guān)聯(lián)特征實現(xiàn)實體之間的關(guān)聯(lián),進行多實體關(guān)聯(lián)分析及多視角的實體分析,實現(xiàn)科學(xué)對象的相互鏈接和揭示,以及科學(xué)對象的導(dǎo)航和統(tǒng)計評價,繼而達到發(fā)現(xiàn)知識之間內(nèi)容關(guān)聯(lián)的需要。
  
  3,3主題圖與知識元庫建設(shè)
  創(chuàng)建知識元庫、構(gòu)建主題圖是實現(xiàn)知識鏈接的基礎(chǔ)。作為一種知識組織體系,主題圖/概念關(guān)系圖是一個由眾多的主題、主題間的關(guān)聯(lián)關(guān)系組成的集合體。主題圖由主題、關(guān)聯(lián)來形成知識的結(jié)構(gòu)與關(guān)聯(lián)。主題可以表示任何概念化的知識?筛鶕(jù)應(yīng)用領(lǐng)域和用戶需求建立相應(yīng)的主題概念集。關(guān)聯(lián)表示相關(guān)主題之間互相的關(guān)系。將主題關(guān)聯(lián)起來,就形成了主題間的語義聯(lián)系。
  文本中的知識元不是孤立的,知識元之間也存在著一定的邏輯關(guān)聯(lián)。知識元有其相對應(yīng)的主題/概念,一個知識元可以對應(yīng)一個或多個主題/概念;反之,一個主題/概念也可以由多個知識元來表達。知識元最合適的表達方式是主題圖,反映知識元之間的各種隱含的有效關(guān)聯(lián)(如等級種屬關(guān)系、矛盾關(guān)系、并列同一關(guān)系、簇類關(guān)系等),通過主題、主題間的關(guān)系以及知識元與資源關(guān)系的表現(xiàn)來組織知識,并將其與相關(guān)信息資源進行鏈接。通過對文本中知識元的抽取,建立知識元與主題/概念間的有機聯(lián)系,形成知識元庫,可以通過知識元本身顯現(xiàn)主題與資源實體之間的一種指向,實現(xiàn)對與知識元庫中相關(guān)聯(lián)的知識間的知識鏈接,形成一對一或一對多的指向,從而揭示單篇文獻的個體“知識元”與某領(lǐng)域共性“知識結(jié)構(gòu)”的鏈接關(guān)系。
  分類法、主題詞表是信息組織的有效工具,在數(shù)字環(huán)境下,分類主題一體化系統(tǒng)作為一種重要的主題圖,可以在知識鏈接中發(fā)揮作用。其主要功能在于表示知識概念間的相互聯(lián)系,利用主題概念間的等同關(guān)系、等級關(guān)系和相關(guān)關(guān)系等豐富的聯(lián)系,結(jié)合知識元庫,定位某一知識概念所在的資源位置,將主題、主題間的相互關(guān)聯(lián)以及主題與信息資源的聯(lián)系以特定的方式直觀地展現(xiàn)出來,使抽象的知識內(nèi)容組織成一個有坐標概念的知識地圖,并形成結(jié)構(gòu)化的語義網(wǎng)絡(luò),借助鏈接技術(shù),將用戶指引到相關(guān)的資源,獲得所需要的知識。
  
  3,4知識要素的抽取標引
  對科技文獻中參數(shù)指標和圖形表格等知識要素的識別與抽取,進行圖形表格語義特征及語義模型、語義屬性的標注和標引,可以建立參數(shù)指標的概念化描述以及與其他知識要素的鏈接關(guān)系,實現(xiàn)數(shù)據(jù)聚合。
  知識要素的抽取標引需要建立圖形、表格的識別模型和匹配模型,利用上下文分析方法自動分析和判讀存儲在計算機中的圖形、表格所處的環(huán)境信息,找出其語義特征;利用參數(shù)指標語義模型,通過語義特征分析判斷圖形、表格所具備的參數(shù)指標屬性,并將相關(guān)屬性進行標注;利用數(shù)據(jù)清洗方法對圖形、表格進行清洗,從而實現(xiàn)參數(shù)指標的識別與分離。并對科技文獻信息中包含的大量圖形、表格及其與上下文的關(guān)系進行分析,通過遞歸算法等推導(dǎo)出參數(shù)指標語義模型,利用機器學(xué)習(xí)理論和上下文分析理論,識別參數(shù)指標;利用數(shù)據(jù)挖掘理論,清洗、析出科學(xué)數(shù)據(jù)。
  利用知識組織中的概念體系,對抽取的參數(shù)指標和圖形表格等知識要素進行概念判斷、識別、歸類、描述和鏈接,利用自動切詞技術(shù),對這些知識要素進行元數(shù)據(jù)描述和知識加工標引,建立知識要素的概念化表達和關(guān)聯(lián)。按照參數(shù)指標等知識要素的元數(shù)據(jù)規(guī)范,進行自動標注從而獲取相關(guān)屬性,建設(shè)知識要素數(shù)據(jù)庫,實現(xiàn)知識要素間的有效鏈接與揭示。
  知識鏈接原理是依據(jù)知識間特有屬性和關(guān)聯(lián)關(guān)系,知識鏈接方法得益于技術(shù)和標準的發(fā)展。開放鏈接標準的應(yīng)用,主題圖、知識元庫、科學(xué)對象詞典、知識本體等方面的研究為建立學(xué)習(xí)環(huán)境和信息環(huán)境之間的鏈接關(guān)系打下了良好的基礎(chǔ)。知識鏈接更加重視面向用戶需求的范疇分類和主題表達,使之更加個性化和可視化,根據(jù)用戶行為特征組織知識和導(dǎo)航知識、挖掘知識和評價知識;重視知識的多樣化、專業(yè)化、層次化、內(nèi)容過濾、知識抽取、顯性知識和隱性知識的轉(zhuǎn)換;更加重視人與人之間的聯(lián)系、機構(gòu)、社團聯(lián)系等。這種分布異構(gòu)的各數(shù)據(jù)庫,通過知識元數(shù)據(jù)庫、引文索引庫和其他知識要素詞典和科學(xué)對象索引耦合起來的整體化數(shù)據(jù)庫集群形成一個集成的知識鏈接體系。任何一個用戶都可以通過文獻之間交錯復(fù)雜的知識鏈接,最大限度地獲得相關(guān)知識信息,從而實現(xiàn)知識管理和知識服務(wù)的目標。

相關(guān)熱詞搜索:構(gòu)建 方式 鏈接 知識鏈接的構(gòu)建方式研究 知識鏈接及其服務(wù)研究 論知識鏈接的建立規(guī)則

版權(quán)所有 蒲公英文摘 www.huhawan.com