【均勻設(shè)計在心理實驗中的應(yīng)用探討】均勻設(shè)計實驗
發(fā)布時間:2020-03-03 來源: 散文精選 點擊:
摘要 均勻設(shè)計是一種由中國數(shù)學(xué)家王元、方開泰在1979年提出的一種新實驗設(shè)計方法,保留并提高了正交設(shè)計的均勻分散性。實驗次數(shù)等于處理水平數(shù)。均勻設(shè)計包括選擇均勻設(shè)計表和安排實驗等步驟。適合于探索性實驗,特別適合于偵測多個因素(2―18個)的交互作用。不但能處理連續(xù)變量,還能處理離散變量?梢栽谛睦韺嶒炛袘(yīng)用。
關(guān)鍵詞 全面實驗設(shè)計;正交設(shè)計;均勻設(shè)計;大魚小池塘問題
分類號 B841
1 引言:從大魚小池塘問題到均勻設(shè)計
心理實驗設(shè)計從簡單到復(fù)雜,從單因素到多因素,從兩水平到多水平,“反映了心理實驗的進步歷程”和“心理科學(xué)的發(fā)展”(朱瀅,2006)。多因素多水平實驗設(shè)計的主要優(yōu)點是能夠揭示變量之間的交互作用(Interaction),提高研究的外部效度(External validity)。但實驗處理組合(Treatment combinations)會因?qū)嶒炓蛩丶捌渌降脑黾佣眲≡黾?方開泰,1994:孫祥,陳毅文,2005)。比如,4×4×4×4的實驗,有處理組合256個,而5×5×5×5的實驗就多達625個。心理學(xué)傳統(tǒng)實驗方法難以容納如此多的實驗處理組合。如果把實驗處理比作“魚”,把實驗設(shè)計比作“池塘”的話,很容易發(fā)現(xiàn)“魚”太大,“池塘”太小。實驗設(shè)計中的這種現(xiàn)象可名之日大魚小池塘問題(Big-fish-little-pondproblem,BFLPP)。
伴隨著BFLPP,實驗設(shè)計經(jīng)歷了全面實驗設(shè)計(Full experimental design)、正交實驗設(shè)計(Orthogonal experimental design)和均勻設(shè)計(Uniform design)等階段。
全面實驗設(shè)計中處理組合數(shù)最多,涵蓋了所有可能的組合。全面實驗設(shè)計既難以實現(xiàn),花費又高。為了提高效率,降低成本,研究者發(fā)現(xiàn)可從所有組合中挑選部分有代表性的處理組合進行實驗。正交設(shè)計就是一種便捷有效的挑選實驗處理的方法。與全面實驗設(shè)計相比,正交設(shè)計所需處理組合大大減少。表1即是一個5×5×5×5的正交設(shè)計示例,有25個實驗處理(即實驗點)。這25個實驗點在三維空間的排列具有“均勻分散”和“整齊可比”兩個特點。與全面實驗需要625個實驗處理相比,無疑是大大地減少了。然而,25個對心理實驗來說仍嫌偏多。因為表1尚未考慮因素間的交互作用。若考慮交互作用,還需增加變量數(shù),即表1還需增加列數(shù)(趙選民,2006)。
其實,正交設(shè)計仍是全面實驗(只不過是局部全面實驗),因為其中任兩列恰好組成一次全面實驗(見表1)。研究發(fā)現(xiàn),“整齊可比”正是實驗處理組合居高不下的根由。方開泰提出放棄“整齊可比”特點,進一步提高實驗點的“均勻分散”特點,并據(jù)此發(fā)展出一種新的實驗設(shè)計――均勻設(shè)計(方開泰,1980)。表2就是前述5×5×5×5那個實驗的均勻設(shè)計,有5個代表性實驗處理組合。
目前,正交設(shè)計已被引入心理研究(孫祥,陳毅文,2005~黃常新,李衛(wèi)萍,2000;柳學(xué)智,1993:黃常新,張其吉;李燕,曹子芳,1997),取得了一定的實效。在這些采用正交設(shè)計的研究中,實驗處理組合至少都有7個,有的甚至幾十個。要是用全面設(shè)計,根本無法實施。而孫祥、陳毅文(2005)向我們表明正交設(shè)計在消費行為研究中的強大功效,一次能夠處理上百個變量。雖然迄今尚未見到以“均勻設(shè)計”為題討論均勻設(shè)計的心理學(xué)文獻,但實際上心理學(xué)很早就開始使用和研究均勻設(shè)計了。蔣聲、陳瑞琛(1987)證明實驗心理學(xué)里一種相當(dāng)成熟的至今仍然在使用的實驗設(shè)計――拉丁方設(shè)計(Latin squares design)即是均勻設(shè)計的一個特例(在實驗處理數(shù) 索性實驗。實驗初期,可用均勻設(shè)計進行探索性實驗,以決定哪些關(guān)鍵因素進入實驗,因素水平取多大范圍。從大規(guī)模實驗處理中探明關(guān)鍵因素,同時,由于是整體估計,可以避免多次單因素實驗帶來的誤差。(2)多快好省地偵測多個因素之間的交互作用。交互作用是多因素多水平實驗關(guān)注的焦點。全面實驗需要考察完所有的情況后才能探明交互作用。正交設(shè)計由于其“整齊可比”的特性,搞的仍是“人海戰(zhàn)術(shù)”。均勻設(shè)計則無需如此。(3)求取變量間的最佳組合關(guān)系。例如,消費行為研究往往涉及上百個品牌屬性(孫祥,陳毅文,2005),人格維度與注意分配的組合多則上千,少則幾十(黃常新,張其吉,2008)。這類情況若運用均勻設(shè)計,可使工作量大大減少,而又不失(按研究需要進行設(shè)定)準(zhǔn)確性。(4)還有一種特殊情況,即需要考察實驗順序、被試差異等對實驗結(jié)果的影響的情形。在傳統(tǒng)心理實驗中,這種情況多用拉丁方設(shè)計加以處理(孟慶茂,常建華,1999)。當(dāng)實驗處理數(shù)很大時,拉丁方設(shè)計就難以勝任了。這時可以采用拉丁型均勻設(shè)計,以擴展其對實驗處理的容量。
2.2均勻設(shè)計的操作步驟
下面以一個5×5×5×5實驗為例。該實驗改編自舒華的《心理與教育研究中的多因素實驗設(shè)計》一書(舒華,2004),即生字密度等對閱讀理解(Y)的影響。原為一個3×3×3的實驗。作者展示了完全隨機設(shè)計、重復(fù)測量設(shè)計等多種設(shè)計方法。其中最省的是三因素被試內(nèi)設(shè)計,只用了4個被試。 現(xiàn)將該實驗改變?yōu)?×5×5×5,研究問題是生字密度、句子長度、文章主題的熟悉度和詞章的優(yōu)美度四個因素之間的交互作用如何?若用完全隨機設(shè)計,需要被試5×625=3125人,這是不現(xiàn)實的。而采用4因素被試內(nèi)設(shè)計,則每個人需閱讀625篇文章,也是難以實現(xiàn)的?尚械倪x擇是采用正交設(shè)計(見表1),但也需要25×5=125人,或者讓5個人每人讀25篇文章,實施起來難度也不小。而用均勻設(shè)計則僅需10個人每人讀5篇文章,簡單易行。因此我們選用均勻設(shè)計,步驟如下:
2.2.1根據(jù)實驗的目的,選擇合適的因子和相應(yīng)的水平。
示例4個因素及其水平如下:
(1)生字密度(A):生字與文章總字?jǐn)?shù)的比值,有5個水平:
1:25、1:20、1:15、1:10、1:5(依次記為:A1-A5)
(2)句子長度(B):文章句子的平均字?jǐn)?shù),有5個水平:
5、15、20、25、30(依次記為:B1-B5)
(3)文章主題的熟悉度(C):文章主題與被試生活的關(guān)聯(lián)程度,有5個等級:
5、4、3、2、1(依次記為:CI-C5)
(4)詞章的優(yōu)美度(D):專家評定的文章的優(yōu)美程度,有5個等級:
5、4、3、2、1(依次記為:D1-D5)
2.2.2選擇合適的均勻設(shè)計表,并根據(jù)均勻設(shè)計表安排實驗。
設(shè)計時,應(yīng)根據(jù)因素數(shù)目及水平數(shù)選擇相應(yīng)的均勻設(shè)計表。由于每因子的水平數(shù)為5,可選用5水平的均勻設(shè)計表。Us(54)。根據(jù)Us(54),結(jié)合其使用表,實驗安排如表2(韓漢鵬,2006)。但表2有一個問題,即最多能考察4個變量和一個交互作用。因此,應(yīng)選用實驗處理數(shù)稍大的均勻設(shè)計表,給誤差留下足夠的自由度。按此原則,我們選擇U*10(108)。根據(jù)U*10(108)的使用表,選擇其中的1、3、4、5列可安排4個因素。由于該表的因素有10個水平,因此需要進行擬水平改制。即將各列中的(1,2)=>1,(3,4)=>2,{5,6)=>3,(7,8)=>4,(9,10)=>5。這樣就得到了U10(55),見表3。
2.3均勻設(shè)計實驗數(shù)據(jù)分析
對均勻設(shè)計所得的實驗數(shù)據(jù),需采用回歸分析方法進行分析。通過分析,可以建立線性回歸模型、二次回歸模型等。表4是模擬的5個被試的實驗數(shù)據(jù)。
2.3.1初始模型設(shè)定與修正
根據(jù)前期探索,我們知道a、b、c、d,及a×b、a×c、a×d、e×d×對閱讀理解可能有影響。于是,初始模型設(shè)定為:Y=m+X1×a+x2b+x3×c+x4×d+x5Xa×b+x6Xa×c+x7×aXd+x8×c×d。其中,a-d-f表實驗因素;x1-x8為需要估計的回歸系數(shù),省略了誤差項。在SPSS中,調(diào)用Regression―Nonlinear過程(數(shù)據(jù)分析也可以用其它軟件實現(xiàn),如SAS、專門的均勻設(shè)計軟件),進行二次曲面回歸分析(張文彤,董偉,2004)。得回歸方程,Y=11.849+44.937×a,-0.187×b+0.591×c-3.980×d-1.789×a×b-29.820×a×c+53.952×a×d+0.898×c×d;貧w方程檢驗F(9,1)=3831.188,p2=0.999。但模型顯示,b、c、c×d的效應(yīng)不大。因此,可去掉它們,于是模型可修正為:Y=m+x1×a+x4×d+x5×a×b+x6×a×c+x7×a×d。
2.3.2模型確定與分析
再次在SPSS中調(diào)用Regression―Nonlinear過程,相應(yīng)設(shè)定后進行二次曲面回歸分析。得回歸方程:Y=3.372+28.984×a+1.253×d-2.812×a×b+14.954×a×c+11.275×a×d。決定系數(shù)R2=1-Residual SS/Corrected SS=0.885。方差分析及回歸系數(shù)的估計見表5、表6。
2.3.3示例結(jié)論
模擬數(shù)據(jù)的分析表明,在生字密度(a)、句子長度(b)、主題熟悉度(c)和詞章優(yōu)美度(d)四個因素中,生字密度對閱讀理解的影響最大,詞章優(yōu)美度次之;而且生字密度與其它三個因素之間均存在顯著交互作用。
3 應(yīng)用均勻設(shè)計進行心理實驗需注意的問題
均勻設(shè)計最大的優(yōu)點是所需實驗次數(shù)少,但該方法本身的局限以及心理學(xué)領(lǐng)域的獨特性決定了只能在一定范圍內(nèi)使用它(見2.1.3)。在實際應(yīng)用中還需注意以下一些問題。
首先,實驗時并不是處理數(shù)越少越好。因為處理數(shù)太少,會損失其精確性。因此需要在效率和精確性之間進行權(quán)衡。對于探索性研究,可以不那么精確;但對正式實驗,則不得不考慮精確性。
其次,沒有重復(fù)實驗的均勻設(shè)計所得結(jié)果可能是不穩(wěn)定的。對此,有兩種策略加以完善。一是采用較大的均勻設(shè)計表,重復(fù)實驗處理。示例即是將實驗處理重復(fù)了1次。方開泰(1994)建議最好讓誤差的自由度>5。二是分步實驗,即先用均勻設(shè)計探明所關(guān)心的交互作用;再有針對性地進行全面實驗。在示例中,如果只有生字密度(a)×句子長度(b)、生字密度(a)×主題熟悉度(c)、生字密度(a)×詞章優(yōu)美度(b)三個交互作用顯著,就可以再設(shè)計三個5×5的實驗,以精確地求取各自的主效應(yīng)和 誤差方差。
第三,均勻設(shè)計除了能處理連續(xù)變量外,還能處理離散變量,如性別,民族等(王柱,方開泰,1999)。處理離散變量與處理連續(xù)變量相比,其選擇均勻設(shè)計表,安排實驗處理等步驟完全一樣;不同之處在于數(shù)據(jù)分析環(huán)節(jié)。設(shè)若某離散變量有m個水平,它可以用通常因素水平的安排法進行設(shè)計,但在分析時,它不是對應(yīng)m個連續(xù)變量,而是對應(yīng)著m-1個相對獨立的特征變量組,即虛擬變量或偽變量(null variable)。除了能處理水平數(shù)相同的情況外,還可以處理不同的情況。在水平數(shù)不同時,需要進行擬水平改制(方開泰,1994)。前文所援引的例子即進行了擬水平改制(詳見2.2節(jié))。
第四,關(guān)于均勻設(shè)計的數(shù)據(jù)分析的問題。實驗設(shè)計方法之所以能提高效率,是因為背后有特定的數(shù)學(xué)模型支持,以達到最優(yōu)。正交設(shè)計在特定的方差分析模型下達到最優(yōu),均勻設(shè)計則在特定的穩(wěn)健回歸模型下達到最優(yōu)(方開泰,馬長興,2001)。前已述及,當(dāng)處理數(shù)小于5時,均勻設(shè)計實際上就是拉丁方設(shè)計。此時可采用重復(fù)測量的方差分析進行分析(Repeated-measures analyses of variance,ANOVAs)(張文彤,2002)。由于方差分析是回歸模型的一個特例,因此拉丁方實驗的數(shù)據(jù)也可用回歸模型加以分析。但當(dāng)實驗處理數(shù)大于5時,所得數(shù)據(jù)需用RS model。需要注意的是,在分析均勻設(shè)計的數(shù)據(jù)時,根據(jù)情況采用合適的回歸模型是非常重要的。孫尚拱(2000)討論了有重復(fù)實驗時的數(shù)據(jù)分析的理論與方法。韓漢鵬(2006)則給出了沒有自由度的回歸模型的檢驗方法。
此外,值得注意的是,實驗設(shè)計只是心理實驗諸多環(huán)節(jié)中的一環(huán)。相比而言,Anderson在其實驗金字塔中所指出的概念設(shè)計等方面可能更需留意(朱瀅,2006)。
4 小結(jié):今后的問題
心理學(xué)發(fā)展中的問題驅(qū)動著心理研究方法學(xué)的發(fā)展。歷史上Spearman為解決發(fā)展智力理論提出了因素分析法,Glass為說明心理治療的效果提出了元分析法都充分地說明了這一點。隨著心理學(xué)研究問題的復(fù)雜日益增加,對研究方法學(xué)會提出更高的要求,這將從更高層次上推動心理實驗方法學(xué)的發(fā)展。心理實驗設(shè)計的進步源于一個普遍存在的矛盾――BFLPP。實驗設(shè)計的每一次進步都可以看作是解決該矛盾的一次新的嘗試。因此不管從心理學(xué)研究的現(xiàn)實需要看,還是從實驗設(shè)計的內(nèi)在發(fā)展邏輯看,系統(tǒng)地介紹和探討均勻設(shè)計都是必要的。
均勻設(shè)計是一種有深厚統(tǒng)計學(xué)基礎(chǔ)的試驗設(shè)計方法。這種由中國人創(chuàng)立的試驗設(shè)計方法已被廣泛應(yīng)用在機械設(shè)計與實驗、醫(yī)藥等領(lǐng)域,在世界范圍內(nèi)產(chǎn)生了良好的影響。但目前我們還沒有查閱到直接以“均勻設(shè)計”為題的心理學(xué)文獻。有意思的是,蔣聲、陳瑞琛(1987)曾用組合數(shù)學(xué)的方法證明了拉丁方設(shè)計(當(dāng)實驗次數(shù)
相關(guān)熱詞搜索:均勻 探討 實驗 均勻設(shè)計在心理實驗中的應(yīng)用探討 心理實驗設(shè)計方案 從眾心理實驗設(shè)計
熱點文章閱讀