[試論網(wǎng)絡環(huán)境下圖情類文獻利用狀況] 幼兒園環(huán)境創(chuàng)設圖片
發(fā)布時間:2020-03-07 來源: 感悟愛情 點擊:
[摘要]運用文獻計量學方法,結合數(shù)據(jù)庫分析工具,基于1994-2006年40種圖情類期刊在數(shù)量、類型、語種狀況的41余萬條引文數(shù)據(jù),分析網(wǎng)絡環(huán)境下傳統(tǒng)學術期刊文獻的利用、傳播與老化規(guī)律;并專門針對期刊網(wǎng)絡引文狀況開展專項調查,從而揭示網(wǎng)絡文獻作為新興文獻類型的利用時效性與語種特征。最后,概括印刷型文獻與網(wǎng)絡文獻的整體利用規(guī)律特點,以期為網(wǎng)絡環(huán)境下的文獻資源建設與用戶服務提供參考借鑒。
[關鍵詞]網(wǎng)絡環(huán)境 圖情類期刊 引文分析 文獻利用
[分類號]G255
科學引文作為學術信息交流傳播的重要手段,其引用/被引關系實際蘊含著文獻間利用/被利用的內在聯(lián)系,可視為知識生產中文獻利用的外在表征。因此,無論將引文作為實體文獻分析,還是作為知識傳播手段考察,都可借助年度數(shù)量變化、時間序列分布、引用半衰期以及類型結構變化等指標,考察文獻利用的狀況規(guī)律。本文選取圖書情報學作為學科樣本,以期刊引文作為數(shù)據(jù)來源,利用CNKI引文數(shù)據(jù)庫的海量數(shù)-據(jù),從引文歷時分布和引文類型結構兩個角度人手,綜合分析了網(wǎng)絡環(huán)境下的文獻利用總體狀況,以期能夠客觀反映文獻利用在現(xiàn)階段的某些規(guī)律。
1 網(wǎng)絡環(huán)境下文獻利用數(shù)N與老化狀況分析
數(shù)字化與互聯(lián)網(wǎng)技術一方面極大提高了傳統(tǒng)印刷型文獻的可獲取性;另一方面也為數(shù)字文獻的傳播利用構筑了更為理想的平臺,從而促使文獻傳播交流空前活躍,進而引發(fā)網(wǎng)絡環(huán)境下文獻利用總體狀況的規(guī)律性變化。而此種深層次變化又通過期刊引文量、歷時分布狀況、文獻老化指標等量化特征予以反映。
1.1 網(wǎng)絡環(huán)境下期刊引文數(shù)量狀況分析
網(wǎng)絡環(huán)境下的文獻利用對象與方式均獲得極大拓展,數(shù)字化技術克服了傳統(tǒng)紙質文獻利用的時空障礙,而網(wǎng)絡文獻的出現(xiàn)也為用戶提供了更為多樣化的選擇。因此,文獻獲取類型方式的日益豐富必然對文獻利用產生深刻影響。
從引文數(shù)量看,40種圖情類期刊1994-2006年共引用文獻416929條,見圖1。
從圖1中能夠清晰地看到文獻利用量在網(wǎng)絡環(huán)境前后所發(fā)生的巨大變化。以1998年為界,期刊引文量在此前(包括1998年)的5年間始終穩(wěn)定在5800篇左右,最大增幅也不過17.6%;而自1998年起,期刊引文量開始呈現(xiàn)急劇增長態(tài)勢,8年間年均增量為8922篇,年均增幅達37%,其中1999―2002年間增幅更是高達59.2%,可見網(wǎng)絡環(huán)境下的文獻利用量較傳統(tǒng)環(huán)境有了大幅提高。
究其原因,網(wǎng)絡環(huán)境下的期刊引文量增長可能受多重因素影響,除文獻可獲取性增強以及傳播范圍擴展以外,文獻生產趨于活躍也會在一定程度下帶動引文量的提高。期刊歷年發(fā)文量以及引文論文量變化趨勢如圖2所示:
通過圖2與圖1增長曲線的比較可以發(fā)現(xiàn),圖2中年度發(fā)文量與含引文文獻量始終處于穩(wěn)定增長中,也就是說,文獻生產狀況并未在特定時間區(qū)間呈現(xiàn)出較其它區(qū)間差異化明顯的增長態(tài)勢,這顯然與圖1中期刊年度引文量增長趨勢不相吻合。此外,著錄規(guī)范化對于期刊引文的促進作用也不可忽視,而值得注意的是新聞出版總署恰恰于1999年印發(fā)了《中國學術期刊(光盤版)檢索與評價數(shù)據(jù)規(guī)范(試行)》,倡導期刊著錄規(guī)范化。但是,著錄規(guī)范化對期刊引文量的影響只能是短期效應,這顯然無法解釋圖1中長達8年的引文量持續(xù)增長,如圖3所示:
更具說服力的是,圖3中文獻篇均引文量與含引文文獻篇均引文量年度變化表明,在排除文獻生產及著錄規(guī)范化因素對引文量的影響后,文獻篇均引文量在1998年后整體仍表現(xiàn)出穩(wěn)定持續(xù)增長態(tài)勢,其在1998-2000年問增長尤為迅速,這也與文獻數(shù)字化與網(wǎng)絡存取在我國的普及時間不謀而合。因此可以初步判斷,網(wǎng)絡環(huán)境下文獻在類型可獲取性、利用方式、傳播渠道等方面的變革,引發(fā)了期刊年度引文量自1999年的持續(xù)快速增長,并進而推動文獻利用整體進入一個更高層次。
此外,調查還發(fā)現(xiàn),i994-2006年圖情類期刊中含引文文獻占文獻總量的比例始終處于增長趨勢,12年間累計增長了39%,從而進一步印證了網(wǎng)絡環(huán)境下文獻實際利用量的增長態(tài)勢,同時也表明文獻生產者的引文意識不斷增強,知識生產中的文獻利用行為也日趨規(guī)范化。此外,這一比例的持續(xù)上升還反映出網(wǎng)絡環(huán)境下用戶文獻利用行為習慣的某些變化,可獲取性的增強大大降低了文獻獲取和利用的時間成本與經濟成本,從而促使文獻生產者在科學研究與知識生產中傾向于利用更大數(shù)量與更多類型的文獻,文獻利用的數(shù)量與范圍均獲得相應提升。
1.2 網(wǎng)絡環(huán)境下期刊引文歷時分布狀況分析
網(wǎng)絡環(huán)境對于文獻利用的影響不儀表現(xiàn)在引文數(shù)量增長層面,還反映在引文歷時分布與半衰期變化規(guī)律方面,即對文獻老化與利用時效性方而的影響。
從期刊引文歷時分布來看,40種圖情類期刊約41萬條參考文獻貫穿整個20世紀至今,其中1970-2006年引文的歷時分布呈現(xiàn)明顯的拋物線趨勢,具體表現(xiàn)為距今最近的5年引文量急速增長至峰值,而后逐漸回落直至平緩遞減的階段性態(tài)勢,如圖4所示:
顯然,圖4中引文數(shù)量在文獻利用周期內的規(guī)律性變化主要是由文獻可獲取性因素決定的。由于文獻自身使用價值、利用方式等多重因素造成的實際可獲取性在某一時期內的規(guī)律性變化以及學科發(fā)展、文獻利用習慣等外部因素的影響,使得文獻在其生命周期各時間點的被引狀況均表現(xiàn)出數(shù)量上的不均勻分布,而各時間點的數(shù)量疊加最終形成圖4中引文歷時分布的拋物線形遞增遞減趨勢。另外,網(wǎng)絡環(huán)境下的文獻利用不同于傳統(tǒng)環(huán)境的~個顯著特征便是數(shù)字化文獻的普及,而這一特征對于文獻生命周期內價值變化規(guī)律的影響也體現(xiàn)在圖4曲線的階段性變化中:由于版權保護和數(shù)字化生產周期等因素影響,期刊文獻在發(fā)表后初期其數(shù)字化版本往往無法及時通過網(wǎng)絡全文獲取,從而影響到其即年被引量;此后隨著文獻數(shù)字化版本可獲取性的增強,其利用量大幅增加,從而引發(fā)圖4曲線急劇上升并在5年處達到峰值;峰值區(qū)間延續(xù)2年后,隨著文獻老化效應的顯現(xiàn),曲線開始自峰值逐年下降,從而進入數(shù)量遞減期,直至老化效應對于文獻利用的影響逐漸衰減,使得引文量變化開始在低數(shù)量水平趨于平緩,最終形成一個長尾。
實質上,網(wǎng)絡環(huán)境下文獻整體利用的時間序列分布是由紙質印刷型文獻、數(shù)字化文獻以及原生網(wǎng)絡文獻三類文獻的利用規(guī)律共同作用的結果,三者效應的疊加一方面促進了文獻利用量在整個生命周期內的普遍性增長;另一方面也對其時間序列分布產生顯著影響。此種效應對于文獻利用數(shù)量而言主要表現(xiàn)為單純的遞增效應,而對于文獻利用量的歷時分布而言,則存在著文獻自身及外部環(huán)境多重復雜因素的共同影響,從而體現(xiàn)出各階段內不均衡的變化態(tài)勢,圖4曲線正是這些因素共同作用的結果。
1.3 網(wǎng)絡環(huán)境下文獻老化規(guī)律分析
通過統(tǒng)計圖情類期刊1994-2006年度引文量與 2002-2006年被引量的時間序列分布,利用半衰期中值法,可計算出歷年的文獻引用半衰期與被引半衰期,進而洞察引文背后所隱藏的文獻老化規(guī)律,如表1所示:
通過表1可以發(fā)現(xiàn),圖情類期刊引用半衰期在2001年前后表現(xiàn)出兩種截然不同的變化規(guī)律,1994-2001年7年間引用半衰期始終未表現(xiàn)出持續(xù)穩(wěn)定的縮短或延長趨勢,而自2001年起,期刊引用半衰期一改先前的震蕩態(tài)勢,逐漸呈現(xiàn)出規(guī)律性的持續(xù)增長特征,其中2006年較2001年延長了21.6%,表明文獻老化出現(xiàn)了顯著的減緩特征;而在2004-2006三年的被引半衰期中,半衰期延長趨勢與老化延緩特征也同樣明顯。此外,計算機類期刊引用與被引半衰期數(shù)據(jù)也反映出類似的趨勢,從而進一步印證了網(wǎng)絡環(huán)境下文獻老化延緩的現(xiàn)象具有一定的學科普遍性。通過表1中圖情類期刊1994-2006年普賴斯指數(shù)變化同樣可以看出,1994-1998年普賴斯指數(shù)平均值為O,677,而1999-2006年該指數(shù)平均值下降為0.643,這從另一角度印證了網(wǎng)絡環(huán)境下文獻老化的延緩特征。
文獻數(shù)字化浪潮興起后不久,便有人預測可獲取性的增強必將大大提高文獻利用的時效性,從而加快文獻老化速度。但是,從上文分析看,網(wǎng)絡環(huán)境下的文獻老化并未呈現(xiàn)加速態(tài)勢,反而表現(xiàn)出某種減緩的跡象。實際上,期刊文獻半衰期的上述變化恰恰反映出網(wǎng)絡環(huán)境所引發(fā)的獲取與利用變革在現(xiàn)階段對于文獻老化所產生的復雜影響,而此種影響可以通過數(shù)字化對于新舊文獻利用的雙重復合影響來獲得合理解釋。
數(shù)字化對于文獻老化影響的根源在于可獲取性的增強。誠然,發(fā)表年限較新的文獻能夠借助數(shù)字形態(tài)的網(wǎng)絡獲取方式更快地為用戶獲取,從而大大提高自身利用的時效性。然而同時我們也應當看到,那些在傳統(tǒng)環(huán)境下由于各種原因難以為用戶獲取或逐漸被人們忽視的“舊文獻”,同樣能夠借助數(shù)字化實現(xiàn)可獲取性的巨大提升,從而迎來新的利用高峰。甚至在實際利用中,由于受版權保護與數(shù)字化周期等因素影響,發(fā)表時間較短的“新文獻”往往無法在第一時間通過網(wǎng)絡獲取,從而大大影響了其利用時效性,最終造成數(shù)字化對“舊文獻”可獲取性的影響實際上要大于對“新文獻”的影響。
因此,數(shù)字環(huán)境下“新文獻”與“舊文獻”利用量變化的相互疊加,共同決定了文獻老化狀況的整體變動趨勢。而在當前環(huán)境下,數(shù)字化對于“舊文獻”利用的促進作用實際要大于“新文獻”,因而舊文獻利用量的提升較新文獻更為明顯,從而形成半衰期延長與文獻老化的延緩趨勢。但是我們可以預見,此種現(xiàn)象只是當前所處數(shù)字化環(huán)境的一個階段性特征,隨著文獻數(shù)字化的不斷推進,其老化整體呈現(xiàn)延緩抑或加速趨勢還應在今后進一步予以考察。
2 文獻利用類型與語種結構分析
隨著文獻數(shù)字化的推進與互聯(lián)網(wǎng)絡的普及,各類型文獻的利用狀況必然受到不同程度的影響,從而表現(xiàn)出各自的數(shù)量變化趨勢,并使得文獻利用在類型結構與語種結構方面均表現(xiàn)出某些規(guī)律性特征。
2.1 期刊引文類型結構分析
期刊引文按照載體介質與存取方式可分為印刷型文獻與數(shù)字文獻兩大類,而印刷型文獻又涵蓋期刊、專著、報紙、學位論文、標準等多種形式,數(shù)字文獻則包括數(shù)字化文獻與純網(wǎng)絡文獻。以圖情類期刊1994-2006年引文為數(shù)據(jù)源,通過程序自動判斷,將416929條引文劃分為11種類型,另有26422條引文類型程序無法判斷,文獻類型數(shù)量分布如圖5所示:
傳統(tǒng)文獻結構中扮演核心角色的期刊文獻在網(wǎng)絡環(huán)境下的文獻利用中依舊占據(jù)主體地位,其被引量約占文獻被引總量的60%。究其原因:一方面期刊發(fā)表周期短,時效性強,能夠及時反映學科前沿最新研究成果,同時期刊文獻經過嚴格審查與出版流程控制,學術水平較高,尤其核心期刊更是獲得學界廣泛認可,因而成為用戶在文獻利用中最為青睞的類型;另一方面,期刊數(shù)字化的蓬勃開展也在不斷鞏固著其在文獻利用結構中的核心角色。此外,專著類文獻依靠其較高的學術價值與理論系統(tǒng)性也成為文獻利用的重要類型,約占文獻被引總量的20%。值得注意的是,網(wǎng)頁文獻憑借其較高的時效性與可獲取性優(yōu)勢,逐漸成為文獻利用的重要類型,其累計被引量已占文獻被引總量的10%以上,其份額還有日益提高的趨勢。最后,排除程序未能有效判斷的文獻,其他7種類型文獻被引量僅占文獻被引總量的5,1%。由此可見,網(wǎng)絡環(huán)境下不同類型文獻在利用數(shù)量上存在顯著差異,并在總體上呈現(xiàn)出明顯的集中離散趨勢,文獻利用類型結構逐漸向期刊、專著和網(wǎng)頁文獻集中,而其他類型文獻利用則趨于離散。
2.2 期刊引文語種結構分析
網(wǎng)絡環(huán)境下的文獻利用結構變革同樣體現(xiàn)在其語種結構方面,不同語種文獻在網(wǎng)絡環(huán)境下的生產與可獲取性差異,使得其利用狀況也呈現(xiàn)差異性。40種圖情類期刊所含416929篇引文中包括中文文獻386355篇,外文文獻30574篇,其1994-2006年歷年語種分布與比例變化分別見圖6與表2。
由圖6可見,1999年之前的引文語種結構以中文文獻為絕對主體,外文文獻在5年間累計被引量不過1851篇,年均被引量也僅有370篇;然而自1999年起,在中文與外文文獻被引量均有所增長的前提下,外文文獻呈現(xiàn)出更為明顯的逐年遞增態(tài)勢,其在引文總量中的比例也不斷提高。具體來看,1999-2006年外文文獻年均被引3583篇,其中2006年被引量較1998年增長了18倍,1999-2006年均被引量較之前5年也增長了近10倍。此外,由表2可以看出,外文引文在引文總量中所占比例自2001年后也呈現(xiàn)持續(xù)增長態(tài)勢,由1994-2001年的年均6.32%上升到2006年的9.69%。由此可見,網(wǎng)絡環(huán)境下外文文獻利用數(shù)量不斷增加,利用范圍不斷增強,從而引發(fā)文獻利用語種結構發(fā)生相應變化。
3 網(wǎng)絡文獻利用狀況分析
網(wǎng)絡文獻,是指Web網(wǎng)絡中具有穩(wěn)定的URL地址,通過HTTP協(xié)議傳遞且能夠明確識別其網(wǎng)絡來源的文獻。網(wǎng)絡文獻的普及可稱得上是文獻利用史上的一次革命,它從根本上提高了文獻的可獲取性、傳播范圍與利用效率,并在潛移默化中改變著用戶的文獻利用內在心理與行為習慣,從而成為網(wǎng)絡環(huán)境下文獻利用的標志性特征之一。
3.1 網(wǎng)絡文獻利用數(shù)量狀況分析
40種圖情類期刊在1994-2006年的416929條引文中共包含網(wǎng)絡文獻45225條,約占引文總量的10.85%,其年度數(shù)量分布見圖7。
通過圖7與圖1比較可以發(fā)現(xiàn),網(wǎng)絡引文與期刊總體引文在年度數(shù)量曲線表現(xiàn)出一定的相似性,即以1998年為界,前段平緩發(fā)展其后逐年增長的階段性變化趨勢。然而,網(wǎng)絡文獻自身特點又使得其利用量增長必然有著區(qū)別于傳統(tǒng)文獻的特征。從圖7看,圖情類期刊網(wǎng)絡引文最早見于1995年,此后4年數(shù)量增長 不大,分別為2篇、2篇、25篇和62篇,與同時期引文總量相比,始終處于低數(shù)量水平。直至1999年,網(wǎng)絡文獻被引量開始顯著增長,年度數(shù)量達到588篇,較1998年增長了840%,而截至2006年被引量更是高達11753篇,較1998年增長了近190倍,同時1999-2006年均增量也達到619篇,平均增幅高達157%,而與之相比,同時期期刊引文總量增幅卻僅有37%。由此可見,網(wǎng)絡文獻利用較傳統(tǒng)文獻表現(xiàn)出更為迅猛的發(fā)展趨勢,同時也表明網(wǎng)絡環(huán)境下以數(shù)字形式生產與傳播的文獻具有更大的優(yōu)越性。此外,網(wǎng)絡文獻引用量的持續(xù)快速增長也表明學術界在網(wǎng)絡文獻出現(xiàn)早期對于它的種種質疑并未成為阻礙其發(fā)展的桎梏,其文獻質量與學術價值正在獲得日益廣泛的認可。
3.2 網(wǎng)絡文獻老化研究分析
迄今為止,傳統(tǒng)文獻老化研究領域已經形成了以半衰期和普賴斯指數(shù)為主要指標,以負指數(shù)模型、巴爾頓一凱普勒老化方程、布魯克斯老化方程等為核心方法的研究體系,而網(wǎng)絡信息資源老化相關研究則始于20世紀90年代末。Bar-Ilan和Peritz在1998、1999年,對網(wǎng)絡信息計量學領域的信息進行了研究,發(fā)現(xiàn)在6個月內近50%的網(wǎng)頁發(fā)生了變化,1年后68%的網(wǎng)頁被從網(wǎng)上移除。2000年5月,Steve Lawrence對從ResearchIndex數(shù)據(jù)庫收錄文獻的引文中提取的67 577個URL進行了可訪問性追蹤,發(fā)現(xiàn)前1年發(fā)表的文獻引用的URL已經有23%無效,1994年發(fā)表的文獻引用的URL無效的高達53%。Diomidis Spinellis利用期刊IEEE Computer和Communications of the ACM文獻中的引文進行了類似研究,表明URL的半衰期是4年。Michael Bugejal和I)aniela v,Dimitrova在2005年和2007年發(fā)表的文獻中指出通訊類期刊的網(wǎng)絡引用半衰期為3.17年。
實際上,網(wǎng)絡信息數(shù)量巨大、類型眾多、變動頻繁、發(fā)布自由的特點使得對網(wǎng)絡文獻老化規(guī)律的測度較傳統(tǒng)文獻更為復雜。網(wǎng)絡文獻的動態(tài)性與非累積性使得海量網(wǎng)絡信息始終處于變動當中,資源一經修改便會自動覆蓋掉其原始信息,造成其原始創(chuàng)建和發(fā)布時間獲取非常困難,同時網(wǎng)絡信息的海量與飛速增長也加劇了其老化測度的難度。因此,網(wǎng)絡資源自身的復雜性動態(tài)性與網(wǎng)絡空間的不確定性使得目前尚難以通過全面的定量測度精確考察網(wǎng)絡文獻的老化狀況,因此更需要我們針對網(wǎng)絡信息自身特點采用創(chuàng)新性思路與方法開展網(wǎng)絡資源老化研究。
3.3 網(wǎng)絡文獻語種結構分析
由于期刊在網(wǎng)絡文獻著錄中多以網(wǎng)絡URL作為文獻名稱,而計算機程序對于以字符形式表現(xiàn)的URL地址往往難以準確判斷其語種類型,因此只能通過小范圍的手工統(tǒng)計方式考察網(wǎng)絡文獻大致語種狀況。筆者選取2002-2006年7種圖情核心期刊作為研究樣本,從每本期刊挑選10篇文獻作為樣本單元,對文后所附參考文獻中網(wǎng)絡文獻的中外文比例進行了考察,如圖8所示:
與圖6中期刊文獻整體語種結構不同,網(wǎng)絡文獻中外文比例雖在五年間略有變化,但并未表現(xiàn)出明顯的規(guī)律性變化趨勢,而是存在一個大致穩(wěn)定的比例值2.5:1。將其與引文整體語種結構對比,能夠發(fā)現(xiàn)網(wǎng)絡文獻利用與印刷型文獻在語種結構方面的巨大差異。對于印刷型文獻來講,目前可獲取的外文文獻較中文文獻在數(shù)量上并不占優(yōu)勢,加之外文文獻自身語言障礙等問題,造成其利用量要遠遠低于中文文獻;與之相比,網(wǎng)絡引文語種狀況則恰恰相反,互聯(lián)網(wǎng)絡的開放性與全球性使得中文網(wǎng)絡文獻喪失了可獲取性方面的優(yōu)勢,而僅僅是語言因素尚難以彌補兩者在學術質量和可獲取數(shù)量上的巨大差距,因而中文網(wǎng)絡引文要遠少于外文。此外,圖8還從另一個角度揭示出了用戶在利用不同語種文獻時的獲取習慣問題,即用戶利用中文文獻時往往傾向于選擇印刷型文獻及其數(shù)字化版本,而利用外文文獻時則會更多地考慮通過網(wǎng)絡直接獲取文獻資源。這種文獻獲取習慣的形成原因來源于多個方面,除上文提及的印刷型文獻與網(wǎng)絡文獻在數(shù)量、語言障礙、可獲取性等方面的差距以外,還與兩類文獻的時效性以及自身質量差異有關。
4 結 語
文獻的數(shù)字化與網(wǎng)絡化作為文獻利用的革命性發(fā)展,不僅表現(xiàn)為文獻利用對象與存取方式的演進,更對文獻利用的年度數(shù)量、類型結構乃至文獻老化等多層面產生深刻影響。通過以圖情類期刊為樣本的引文分析,可概括出網(wǎng)絡環(huán)境下的文獻利用具有以下特點:①文獻類型日益豐富,利用類型結構呈獻出非均衡性發(fā)展,網(wǎng)絡文獻成為新興的重要類型;②用戶文獻利用習慣日趨規(guī)范化,含引文文獻量、篇均引文是與發(fā)文呈同步增長;
[作者簡介]索傳軍,男,1964年生,教授,博士生導師,國家圖書館研究院院長,發(fā)表論文50余篇,出版著作5部。游毅,男,1984年生,碩士,發(fā)表論文3篇。
相關熱詞搜索:下圖 試論 文獻 試論網(wǎng)絡環(huán)境下圖情類文獻利用狀況 論網(wǎng)絡環(huán)境下文獻資源共享 圖書情報
熱點文章閱讀