【Mashup國內(nèi)外研究綜述】 國內(nèi)外研究綜述
發(fā)布時間:2020-03-07 來源: 短文摘抄 點擊:
[摘要]對2005~2009年國內(nèi)外Mashup研究論文,從來源數(shù)據(jù)庫、發(fā)表時間方面進(jìn)行統(tǒng)計分析,并按主題簡要介紹該領(lǐng)域理論研究和應(yīng)用研究兩個層次的主要成果,并對這些成果從內(nèi)容和研究方法上進(jìn)行述評,指出Mashup發(fā)展中存在的不足,對研究中存在的問題進(jìn)行分析總結(jié),并對未來該領(lǐng)域的研究趨勢進(jìn)行預(yù)測。
[關(guān)鍵詞]聚合 API 信息服務(wù) 網(wǎng)絡(luò)學(xué)習(xí)
[分類號]G202
近年來“Mashup”新型網(wǎng)絡(luò)應(yīng)用在Intemet上廣泛興起,根據(jù)維基定義“Mashup:網(wǎng)絡(luò)聚合應(yīng)用,把來自兩個或多個外部資源的數(shù)據(jù)或功能整合起來創(chuàng)建一項新服務(wù)的網(wǎng)頁或Web應(yīng)用程序”可知,Mashup是從多個分散站點獲取信息源,組合成一種新型網(wǎng)絡(luò)應(yīng)用模式,它利用的外部數(shù)據(jù)源格式多種多樣,兼容性驚人。今天,博客、網(wǎng)摘、圖片、視頻等服務(wù)廣泛應(yīng)用,促進(jìn)了Mashup研究熱潮,引起國內(nèi)外學(xué)者重視。本文將對其研究現(xiàn)狀進(jìn)行綜述,揭示近年來該主題研究的發(fā)展軌跡、研究路線、學(xué)術(shù)成果及存在的相關(guān)問題,并對其發(fā)展進(jìn)行展望。
1 Mashup研究現(xiàn)狀概述
筆者利用CNKI,以“mashup”為檢索詞,進(jìn)行篇名及關(guān)鍵詞檢索,經(jīng)篩選得到國內(nèi)研究論文43篇;并以相同檢索條件,在國外四大權(quán)威數(shù)據(jù)庫ACM、ProQuest、ScienceDirect、SpringerLink中進(jìn)行檢索,篩選后分別得到16篇、3篇、2篇、21篇主題研究文獻(xiàn),共為5l篇(包括著作兩本)。國內(nèi)外合計為94篇。如表1所示:
數(shù)據(jù)表明,對Mashup關(guān)注始于2006年。國內(nèi)研究稍早于國外,原因是2006年國內(nèi)圖書情報界對“跨界合作”的研究熱潮。Mashup特有的重新整合網(wǎng)絡(luò)資源應(yīng)用的方式,激起了軟件開發(fā)者與廣大普通網(wǎng)民的極高熱情,并吸引了越來越多研究者投入其中,研究熱度持續(xù)上升,論文年度數(shù)量分布呈現(xiàn)出明顯的遞增趨勢。國內(nèi)外對Mashup的研究主要包括基礎(chǔ)理論研究和應(yīng)用研究,論文將從這兩方面展開綜述。
2 Mashup理論研究現(xiàn)狀
在理論研究方面涉及主要內(nèi)容有Mashup定義、架構(gòu)、關(guān)鍵技術(shù)、平臺工具。
2.1 定義
學(xué)者大都認(rèn)同維基定義及著名Mashup網(wǎng)站的定義即Mashup網(wǎng)站是一個Web頁面或應(yīng)用程序,從兩個或以上的外部在線資源連接數(shù)據(jù)。外部資源極可能是其他的Web站點,并且站點上的數(shù)據(jù)被“mashup開發(fā)員使用不同的方法獲得,這些方法包括但又不僅僅局限于APIs,XML數(shù)據(jù)源(XML Feeds)和屏幕抓取”。
較早對Mashup進(jìn)行明確定義的是加拿大學(xué)者菲克特(Darlene Fichter),她指出“Mashup:把多個信息源整合起來創(chuàng)建一個全新的網(wǎng)站或者網(wǎng)絡(luò)應(yīng)用!贝送猓袑W(xué)者把Mashup定義為一種網(wǎng)絡(luò)技術(shù),這種技術(shù)結(jié)合了多個來源的信息到一個單一的Web應(yīng)用程序,這種技術(shù)為人們整合不同來源的數(shù)據(jù)提供了一個新的平臺。
我國學(xué)者黃倩則提出Mashup是新一代的軟件開發(fā)模式,交互式的Web應(yīng)用開發(fā)模式涉及了Web2.0,SaaS,SOA等多種技術(shù)的融合應(yīng)用,它通過不同渠道獲取外部數(shù)據(jù)源創(chuàng)建全新的服務(wù),提供統(tǒng)一體驗的互聯(lián)網(wǎng)應(yīng)用。而王萍、張際平提出“Mashup的內(nèi)涵在于整合不同外部數(shù)據(jù)源的內(nèi)容和服務(wù),把松散的學(xué)習(xí)資源、要素、服務(wù)和功能集成在網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之中,提供增值的、創(chuàng)新的內(nèi)容、服務(wù)和統(tǒng)一完整體驗的Web信息系統(tǒng)”。
筆者認(rèn)為在定義Mashup時應(yīng)注意Mashup還是一種理念,它是將整合、混搭的理念用于Web服務(wù)構(gòu)建而形成的一種嶄新的模式。
2.2 架構(gòu)
大部分學(xué)者認(rèn)同Mashup的三層架構(gòu)模式,即:①API/內(nèi)容提供者,提供了建設(shè)Mashup網(wǎng)站所需內(nèi)容。為了方便外界獲取和使用,提供者將自己的內(nèi)容通過Web協(xié)議,采用API的形式對外提供。②Mashup服務(wù)器。負(fù)責(zé)把所獲得的或者是自有的資源和服務(wù)封裝成標(biāo)準(zhǔn)組件,并管理這些組件,同時響應(yīng)應(yīng)用程序?qū)τ谫Y源、服務(wù)的開放調(diào)用。③客戶機(jī)Web瀏覽器。以可視化方式呈現(xiàn)應(yīng)用程序的地方,也是用戶交互發(fā)生的地方,Mashu P通常都使用客戶機(jī)端的邏輯來構(gòu)建合成內(nèi)容。
然而,上述Mashup三層架構(gòu)模式存在著不足,許多學(xué)者提出了相應(yīng)改進(jìn)模型。代表性的有:陸璐瑩針對“Mashup缺乏語義信息”提出了基于語義Web的Mashup設(shè)計架構(gòu),將其體系架構(gòu)分為四層,即頁面顯示層、業(yè)務(wù)邏輯層、語義處理層以及服務(wù)實現(xiàn)層;Zahoor E提出了名為“Mashup處理網(wǎng)絡(luò)(MPN)”的系統(tǒng)架構(gòu)模型,該模型由四部分組成:數(shù)據(jù)流生產(chǎn)者、數(shù)據(jù)流消費(fèi)者、Mashup流程代理、以及用來發(fā)送Web服務(wù)請求和接收響應(yīng)的溝通渠道;還有學(xué)者提出基于質(zhì)量控制的Mashup架構(gòu)等。語義Web架構(gòu)模型滿足了用戶的靈活需求,而MPN架構(gòu)模型則克服了傳統(tǒng)Mashup系統(tǒng)缺乏長期穩(wěn)定性和系統(tǒng)健壯性的缺陷等問題。這些改進(jìn)模式推動了Mashup更快更健全的發(fā)展。
2.3 關(guān)鍵技術(shù)
筆者通過對相關(guān)資料的研究發(fā)現(xiàn):Mashup根生于Web2.0環(huán)境,形成與發(fā)展都離不開Web2.0相關(guān)技術(shù)的支持,支撐其發(fā)展的技術(shù)有:
?Ajax。一種Web應(yīng)用模型,關(guān)注內(nèi)容的異步加載和呈現(xiàn)方式,是多種技術(shù)的集合。目前研究的核心技術(shù)包括:①XMLHttpt,一套可以在JavaScript等腳本語言中,通過H237P協(xié)議傳送或接收XML及其他數(shù)據(jù)的一套API;②文檔對象模型(DOM),提供對文檔內(nèi)容、結(jié)構(gòu)、風(fēng)格進(jìn)行訪問和更新的應(yīng)用程序接口;③JavaScript,用于客戶端的腳本語言,是一種被瀏覽器全面支持的輕型設(shè)計語言。
?Web協(xié)議。主要包括SOAP和REST協(xié)議,是與平臺無關(guān)的遠(yuǎn)程通信協(xié)議。SOAP是一種輕量的、簡單的、基于XML的協(xié)議,它被設(shè)計成在Web上交換結(jié)構(gòu)化的和固化的信息。但是隨著標(biāo)準(zhǔn)不斷被提出,SOAP變得臃腫,操作變得越來越復(fù)雜,REST(一種針對網(wǎng)絡(luò)應(yīng)用的設(shè)計和開發(fā)方式,可以降低開發(fā)的復(fù)雜性,提高系統(tǒng)的可伸縮性)的出現(xiàn)解決了這一問題,最終推動了Mashup的快速發(fā)展,并帶來了信息組織與信息服務(wù)范式的變革。
?屏幕抓取。抓取是使用軟件工具處理并分析最初為人們閱讀而編寫的內(nèi)容,從中提取出可以通過編程進(jìn)行使用和操作的信息的語義數(shù)據(jù)結(jié)構(gòu)表示。當(dāng)缺乏內(nèi)容提供者提供的API時通常會強(qiáng)制要求mashup開發(fā)人員采取屏幕抓取方式來提取自己希望集成的信息。目前有很多屏幕抓取工具可供mashup者使用,但由于其自身固有的缺點及給使用者帶來的侵權(quán)風(fēng)險,制約了它在該領(lǐng)域的應(yīng)用。
?語義Web。其目標(biāo)是創(chuàng)建Web基礎(chǔ)設(shè)施,使用元數(shù)據(jù)對數(shù)據(jù)進(jìn)行增強(qiáng),從而使數(shù)據(jù)變得有意義,最終使數(shù)據(jù)變得適合進(jìn)行自動化、集成、推理和重用,它的 實現(xiàn)依賴于XML、RDF和Ontology三大關(guān)鍵技術(shù)。它的出現(xiàn)彌補(bǔ)了屏幕抓取技術(shù)的缺陷。但至今,語義Web仍未能找到一種方法來表示所有的數(shù)據(jù)使得在連接到網(wǎng)絡(luò)時某一數(shù)據(jù)可識別并建立與其他相關(guān)信息的鏈接。
?RSS和ATOM。RSS是一種描述和同步顯示網(wǎng)站內(nèi)容的格式,是目前使用最廣泛的資源共享應(yīng)用。但其被開發(fā)者凍結(jié)的核心內(nèi)容不能滿足內(nèi)容聚合開發(fā)者的需要,因此研究者開發(fā)了ATOM來彌補(bǔ)RSS的開放性不足的問題,人們通過Atom提供比RSS更好的元數(shù)據(jù)維護(hù)和更為全面的文檔。這些聯(lián)合技術(shù)對于集成基于事件或更新驅(qū)動內(nèi)容的Mashup來說都非常有用。
2.4 平臺工具
目前已推出的Mashup開發(fā)工具主要有Yahoo!Pipes、Microsoft’s PopFly、Google Mashu PEditor、IBMDamia以及Intel@Mash Maker等。這些Mashup平臺工具各有特點:微軟的Popfly開發(fā)過程簡單,用戶體驗好,但如果創(chuàng)建一個新的Mashup,很可能會導(dǎo)致出現(xiàn)瀏覽器崩潰的情況;雅虎Yahoo!Pipes則對數(shù)據(jù)格式要求較嚴(yán);Google Mashup Editor相當(dāng)于一個在線的可視化工作室,功能很強(qiáng)大,有編輯、編譯、運(yùn)行等功能,可以很方便實現(xiàn)Ajax功能,對中文支持比較好;目前英特爾Intel Mash Maker使用門檻高,使用者必須對網(wǎng)站內(nèi)容及技術(shù)有一定程度的認(rèn)識。上述開發(fā)平臺要真正達(dá)到廣大普通用戶的mashup要求,還需研究者繼續(xù)努力。
3 Mashup應(yīng)用研究現(xiàn)狀
Mashup應(yīng)用發(fā)展迅速。來自名為programmableweb網(wǎng)站的數(shù)據(jù)顯示,截至2009年8月22日,全球在網(wǎng)站上注冊的API數(shù)1430個,基于API開發(fā)的Mashup應(yīng)用達(dá)到4261個,平均每天增長約3個,開放API的出現(xiàn)促進(jìn)了用戶進(jìn)行Mashup開發(fā)的熱情,使之在各領(lǐng)域得到迅速發(fā)展,其典型應(yīng)用領(lǐng)域有:①地圖Mashup。地圖是Mashup最主要的應(yīng)用領(lǐng)域,約占其所有應(yīng)用的35%。人們搜集大量有關(guān)事物和行為的數(shù)據(jù),而這兩類數(shù)據(jù)常具有位置注釋信息,所有這些包含位置數(shù)據(jù)的不同數(shù)據(jù)集均可利用地圖通過圖形化方式呈現(xiàn)出來。②圖片和視頻Mashup。內(nèi)容提供者擁有與其保存的圖像相關(guān)的元數(shù)據(jù),Mashup的設(shè)計者可以將這些照片和其他與元數(shù)據(jù)相關(guān)的信息進(jìn)行關(guān)聯(lián)。③搜索和購物Mashup。在Mashup這個術(shù)語出現(xiàn)之前,搜索和購物Mashup就已經(jīng)存在很長時間了。在Web API出現(xiàn)之前,有相當(dāng)多的購物工具,都使用了B2B技術(shù)或屏幕抓取的方式來累計相關(guān)的價格數(shù)據(jù)。為了促進(jìn)Mashup和其他web應(yīng)用程序的發(fā)展,諸如eBay和Amazon之類的消費(fèi)網(wǎng)站已經(jīng)發(fā)布了自己的API,以供開發(fā)者調(diào)用。
文獻(xiàn)資料顯示,學(xué)者們探究的Mashup應(yīng)用研究方向卻大相徑庭,涉及的主要領(lǐng)域有:
?企業(yè):Mashup與企業(yè)結(jié)合是國外學(xué)者研究的熱點之一。由于移動運(yùn)營商可以借助Mashup拓展產(chǎn)業(yè)鏈、全面進(jìn)入信息領(lǐng)域,mashup在移動互聯(lián)網(wǎng)上的應(yīng)用是學(xué)者研究的重中之重,并取得了一定成果:我國學(xué)者郭靖和郭晨峰對Mashup應(yīng)用于移動互聯(lián)網(wǎng)的應(yīng)用前景、關(guān)鍵問題、實現(xiàn)平臺及主要的應(yīng)用方向等做了介紹;芬蘭與德國學(xué)者提出了一個TELAR Mashup平臺,該平臺基于客戶端/服務(wù)器的解決方案,有利于為移動設(shè)備建立一個基于位置信息的Mashup系統(tǒng);日本學(xué)者提出了一個應(yīng)用于移動互聯(lián)網(wǎng)的Mashup工具,目的是為移動用戶提供一個個性化的顯示方式,同時整合了一些其他的服務(wù)。然而,Mashup在企業(yè)中的應(yīng)用并不僅僅局限于移動互聯(lián)網(wǎng)行業(yè),學(xué)者同樣研究了適用于廣大企業(yè)的Mashup平臺,代表性的有美國學(xué)者提出的企業(yè)Mashup應(yīng)用平臺(EMAP),詳細(xì)探討了EMAP的模型及架構(gòu),分析了企業(yè)Mashup取得成功的關(guān)鍵因素。實踐證明通過這個靈活的平臺,Mashup應(yīng)用開發(fā)商能夠迅速地編寫企業(yè)級質(zhì)量的應(yīng)用,用戶則可以簡便地創(chuàng)建高度個性化的應(yīng)用。作者還根據(jù)企業(yè)中投資收益率的原則,預(yù)測這項應(yīng)用將很快被廣大企業(yè)所采用。文介紹了企業(yè)Mashup的主要組成部分,并探討了這一新模式的設(shè)計原則及架構(gòu),進(jìn)而說明了這種Mashup架構(gòu)能夠在短時間內(nèi)為獨立或異構(gòu)企業(yè)提供相應(yīng)的應(yīng)用。
?生物醫(yī)學(xué):生物醫(yī)學(xué)領(lǐng)域中龐大的數(shù)據(jù)信息以不同的存儲格式分布在不同網(wǎng)絡(luò)環(huán)境的數(shù)據(jù)庫中,急需一種網(wǎng)絡(luò)技術(shù)或工具把它整合起來以便于應(yīng)用。加拿大學(xué)者詳細(xì)介紹了Bio2RDF Mashup系統(tǒng),開發(fā)了整合帕金森癥四個轉(zhuǎn)錄因子基因相關(guān)信息的Mash,up系統(tǒng);耶魯大學(xué)學(xué)者探討用Mashup來整合醫(yī)療衛(wèi)生和生命科學(xué)信息。
?其他。包括Mashup在圖書館、教育、音樂等領(lǐng)域的應(yīng)用。Mashup在圖書館主要用于圖書館書目信息服務(wù),教育界則主要是網(wǎng)絡(luò)學(xué)習(xí)方面;ヂ(lián)網(wǎng)中各類信息的海量增長,必將促使Mashup在更多領(lǐng)域得到更廣泛的應(yīng)用。
4 Mashup研究存在的問題
隨著Mashup的迅速發(fā)展及廣泛應(yīng)用,一些技術(shù)問題、社會問題、跨組織邊界應(yīng)用問題給我們提出了新的挑戰(zhàn),如:①知識產(chǎn)權(quán)保護(hù)問題。Mashup主要技術(shù)之一――屏幕抓取技術(shù)本身就存在著侵權(quán)的可能性,Mashup開發(fā)人可能以未獲得API內(nèi)容提供者批準(zhǔn)的方式使用其內(nèi)容,造成侵權(quán)。②數(shù)據(jù)語義與數(shù)據(jù)質(zhì)量問題。Mashup數(shù)據(jù)源自不同機(jī)構(gòu)、組織、個人,Mashup開發(fā)者可能并不是源數(shù)據(jù)模型領(lǐng)域的專家,他們對源數(shù)據(jù)語義的理解是否準(zhǔn)確,異構(gòu)數(shù)據(jù)模型的轉(zhuǎn)換、映射是否完整、真實,開放的數(shù)據(jù)提供帶來的數(shù)據(jù)污染,屏幕抓取數(shù)據(jù)具有不穩(wěn)定性等都可能造成Mashup應(yīng)用失敗。③標(biāo)準(zhǔn)化問題。目前Mashup領(lǐng)域缺乏統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,制約了其進(jìn)一步發(fā)展。④尚未形成明確的商業(yè)盈利模式。如內(nèi)容提供者如何收取服務(wù)費(fèi)用,這將影響商業(yè)性數(shù)據(jù)庫向Mashup領(lǐng)域的介入。
5 研究熱點及發(fā)展趨勢
Mashup產(chǎn)生背景決定了其具有應(yīng)用性非常強(qiáng)的特點。從上文分析可以看出學(xué)者主要關(guān)注Mashup應(yīng)用研究,對其基礎(chǔ)理論探究則相對較少,應(yīng)用研究主要集中在企業(yè)、生物醫(yī)學(xué)等領(lǐng)域,探究如何整合這些領(lǐng)域中的相關(guān)信息從而為用戶提供更方便、更個性化的使用。該類研究國內(nèi)外存在著巨大差異,國內(nèi)對Mashup的應(yīng)用研究主要集中在圖書館、教育及移動互聯(lián)網(wǎng)等領(lǐng)域,對其在廣大企業(yè)和生物醫(yī)學(xué)領(lǐng)域的應(yīng)用則沒有涉及。因此,Mashup在此兩大領(lǐng)域的應(yīng)用,將是我國學(xué)者研究熱點之一。
此外,針對Mashup應(yīng)用中存在的數(shù)據(jù)語義、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、Mashup系統(tǒng)改進(jìn)等也是現(xiàn)階段研究熱點之一。目前Mashup開發(fā)者主要集中在高學(xué)歷水平的學(xué)者或軟件開發(fā)人員,且許多國外優(yōu)秀的Mashup開發(fā)平臺在國內(nèi)并沒有中文版本,更加大了其開發(fā)難度。Mashup今后將沿著更加平民化、簡易化方向發(fā)展。
相關(guān)熱詞搜索:綜述 國內(nèi)外 研究 Mashup國內(nèi)外研究綜述 國內(nèi)外研究綜述 flash國內(nèi)外研究綜述
熱點文章閱讀