【羅夏墨跡技術的近期發(fā)展與爭論】 羅夏墨跡測驗
發(fā)布時間:2020-03-03 來源: 人生感悟 點擊:
摘 要:綜合系統(tǒng)在羅夏墨跡技術(RIM)的標準化、客觀化方面取得了很大的成功,但仍有一些批評者對它的信度、效度、常模與標準化等問題提出了質疑,作者們對這些爭論的焦點問題進行了系統(tǒng)的回顧。總結有關的元分析和實驗研究,發(fā)現RIM的多數核心變量都有較好的評分者信度和跨時間穩(wěn)定性,只有心理狀態(tài)變量的信度較低。以往的整體元分析和局部元分析都發(fā)現RIM不遜于其他測驗。這些結果表明RIM在臨床疾病診斷,外顯行為預測方面都是有價值的。與其他測驗一樣,RIM也有其優(yōu)勢與不足,在應用中應與其他測驗互補。
關鍵詞:羅夏墨跡技術;效度;信度;常模與標準化
羅夏墨跡技術(R/M)是歷史上爭議最多的心理測驗,直到今天仍然是應用最廣的測驗之一。RIM的支持者主要有Exner,Weiner,Meyer,Hiller,Bomstein等,他們一直在反駁批評者,捍衛(wèi)RIM的價值,但他們對RIM的認識也更加中肯,認識到了RIM的長處與短處,而不像有些人那樣不現實地鼓吹RIM(如認為RIM是最好的測驗,是透視人格的x光)。批評者則主要有Wood,Nezworski,Garb,Lilienfeld,Florio等,他們堅持懷疑RIM的心理測量學性能,認為RIM僅僅具有很有限的用途,建議取消RIM。
我國除有少數學者嘗試使用RIM外,多數人則持觀望態(tài)度。那么在心理測量技術日益多樣化,新的測量技術不斷出現的今天,還有沒有必要研究和推廣RIM?RIM是否具有其他測量工具不具備的功能?使用RIM所帶來的增值(incremental)效度是否大于使用成本?近10年來,國外RIM的支持者與反對者圍繞RIM的信度、效度、常模與標準化等問題進行了多次辯論。學者們采用元分析研究、追蹤研究、實驗研究和相關研究等佐證了不同觀點,這些辯論使人們對RIM的性能有了更清晰的認識。本文的目的就在于系統(tǒng)地回顧和介紹這些觀點,使讀者公正地評價這一測驗,進而在是否使用這一測驗上做出判斷。
1 關于RIM的信度
關于RIM的信度研究很多,在PsycINFO中能找到大量的資料。近期Weiner所做的文獻回顧顯示,部位分、對稱分、常見回答和z分的評分者信度高于90%,而決定因素和特殊分的評分者信度系數是85%左右。Exner發(fā)現13個核心變量的重測穩(wěn)定系數不低于0.80。但是心理狀態(tài)性變量的重測信度系數較低,例如,焦慮變量Y會隨時間不同而發(fā)生波動。Exner的結果中還顯示出兒童的重測結果會發(fā)生變化,但這些變化都可以根據發(fā)展心理學的理論進行解釋。
但是批判者仍提出了很大的疑問,認為RIM不論在評分者信度還是重測信度上都存在問題。他們認為不同評分系統(tǒng)的施測者其測試結果不能做一致性分析,即使是采用同一個評分系統(tǒng)由于評分者主觀性太強也容易造成評分者信度的差別。針對這種觀點,2002年Gronnerod收集了PsyclNFO數據庫中1921~2002年間所有關于時間穩(wěn)定性的研究,并把方法上存在問題和記分標準不一致的研究全部刪去,對符合要求的作了元分析。結果顯示羅夏記分存在很好的跨時間穩(wěn)定性,在3年以上時間間隔的重測中,重測穩(wěn)定性系數在0.68~0.73之間。在消除各種中介變量的系統(tǒng)影響后,用回歸方程預測重測信度,則三年以上時間間隔的理想值為0.77~0.97,5年以上的理想值為0.65~0,90。
當然并不是在所有情況下RIM的信度都令人滿意。如果主試未受過訓練或沒有經驗,那么評分者信度系數很低。對心理特征不穩(wěn)定的被試,重測相關也低,如不同年齡發(fā)展階段的兒童,有情緒障礙的病人,或不斷變化的精神障礙患者。
2 關于RIM的效度
效度可以說是所有RIM爭論的焦點。RIM的支持者對其效度的研究主要集中在臨床診斷的準確性和預測性。第一個證明RIM有效性的研究是由Benjamin和Ebaugh發(fā)表的。在這個研究中的46個案例中,羅夏的解釋與臨床上的診斷完全一致的占84.7%。而Brussel和Hitch報告的案例中臨床診斷和RIM的一致性高達98%。像這樣的結果是特殊的,并且不能在任何時候都能被重復驗證。在發(fā)表的研究中也有大樣本(N=101)的案例,如Michael和Buhle研究中報告了臨床診斷與RIM結果間的一致性達76%,在精神神經質組(psychoneurotic group)二者的一致性最高,在病態(tài)人格組(psychopathicpersonality)則一致性則非常低。
元分析方法是檢驗測驗效度的有效方法,對RIM的元分析有整體元分析(即整體地檢驗所有記分的效度)和局部元分析(只檢驗RIM中單個量表或記分的效度)。有三個整體元分析影響非常大。如Aikinson的研究中顯示RIM的平均效度是0.36,MMPI的平均效度是0.40。1988年Parker等人用元分析方法對RIM、MMPI和WAIS中的記分或分量表的效度進行了比較,得到的平均效度分別是0.37、0.43和0.57。但1998年Garb,Florio和Grove對Parker等人的元分析結果進行了再分析,得到RIM的效度是0.29,MMPI效度是0.48,他們發(fā)現當刪除存在共同方法的研究和報告了X2的研究時RIM的效度是0.36,MMPI的效度是0.55。Garb等由此認為Parker等人夸大了RIM的效度,RIM的效度明顯低于MMPI,因此他們主張廢除RIM。
針對Garb等人的批評,Meyer與Archer搜集了1970~1981年間joumal of personality assessment和joumal ofclinical psychology中報告的效度系數,發(fā)現若對研究不加篩選,則RIM的平均效度系數為0.33,MMPI的平均效度系數是0.22,若刪除共同方法的影響,則RIM的效度是0.27,MMPI的效度是0.25,WAIS的效度是0.36。又因為Hiller等對在1977~1997年間發(fā)表在任何雜志上的文章進行的元分析表明RIM的效度是0.29,MMPI的效度是0.30,因此Meyer與Archer認為RIM的效度不低于MMPI。回顧這些元分析研究,我們還發(fā)現RIM的效度比MMPI更為穩(wěn)定。
1990~2000年間,許多研究對RIM與其他測驗對相同效標的預測結果做了局部元分析(只檢驗單個記分或量表的效度)。如Bornstein的研究顯示RIM的口唇依賴量表(Oral Dependence Scale)與外部行為表現的相關是0.37,而其他測驗(如TAT依賴量表,Blacky圖片測驗口唇依賴量表,MMPI依賴量表,MCMI依賴量表,EPPS求助心態(tài)量表,IDI 依賴量表)與外部行為的相關在0.17~0.50之間,可見RIM的預測效度較高。
Meyer、Handler[12J3]和Meye對RIM測驗與其它測驗對治療結果的預測效度進行了比較,結果顯示RIM的PRS量表的預測效度是0.45,MMPI自我力量量表的預測效度是0.02,IQ的預測效度是0.15,RIM測驗中PRS量表對IQ量表的增益效度是0.36。
Romne比較了RIM與其他幾個相關測驗對區(qū)分精神分裂癥病人與控制組的效度,結果顯示RIM的言語偏差量表的效度是0.22,Lovibond物體分類測驗效度是0.23,所有非羅夏的思維過程測驗的效度是0.23。
Bornstein的研究比較了幾個測驗對身體疾病的預測效度,羅夏口唇依賴量表的預測效度是0.72,主題故事方法的效度是0.29,DSM訪談的效度是0.09,自陳量表的效度是0.18。
Meyer與Archer收集了以往所有關于RIM、MMPI和WAIS中單個記分或量表的效度研究結果,并對其效度系數進行比較,發(fā)現RIM記分的效度在0.14~0.46之間,平均為0.34;MMP分量表的效度在0.02~0.78之間,平均為0.2835;IQ的效度在0.12~0.52之間,平均為0.31可見RIM單個記分的效度更高,而且更為穩(wěn)定。但在服務于不同目的時,三個量表的有效性是不同的。如RIM中的X-%記分對精神病組和控制組的鑒別效度是0.461171,RIM中的PRS量表在IQ基礎上對治療效果的預測效度是0.36,RIM中的DEPI指數對抑郁癥鑒別的效度是0.14。MMPI基礎量表的效度是0.78,MMPI依賴量表對依賴行為的預測效度是0.20,MMPI自我力量量表對心理治療效果的預測效度是0.02,WAIS中的IQ分對癡呆患者的鑒別效度是0.52,對工作表現的預測效度是0.25,IQ測驗與交通事故的相關是0.12。
從以上資料可以看出RIM、MMPI和IQ的效度,隨著預測標準的功能變化而變化。對某些目的來說RIM的效度優(yōu)于其他測驗。例如,SCZI能對精神病進行診斷等。這個道理對于其他測驗也適用。例如MMPI善于從控制組中鑒別出精神病患者,而不善于預測犯人的胡作非為,IQ測驗善于鑒別出癡呆而不能預測飛行員的成功。然而,任何一個測驗都不可能在所有的方面都是有效的。
不論支持還是批判RIM的學者都承認測驗中的一部分記分是有效的。即使對RIM持批判態(tài)度的心理學家也認為其結果能鑒別思維障礙者,并且通過思維障礙者的特征對不同精神障礙者加以鑒別,測量依賴性,預測治療的結果。
可見否定RIM效度的說法沒有根據。在很多時候RIM的效度高于其他心理測驗。因此如果恰當地使用RIM,將會得到非常有價值的結果。
3 關于RIM的常模與標準化
從20世紀70年代至今,樣本的標準化問題一直是RIM的一個爭論點。在RIM的發(fā)展的歷史中,Klopfer所倡導的RIM是以精神分析理論為導向的,并不關注測驗的心理計量學特征并且拒絕標準化這個特征。而Beck和Rapaport所提倡的RIM系統(tǒng)中有標準化數據,但是他們的標準化樣本很小且沒有代表性。
與早期的這些系統(tǒng)相比較,綜合系統(tǒng)因有標準化樣本而在發(fā)展過程中越來越受到推崇。在20世紀70年代晚期,Exner建立了正常成人、兒童和不同種類精神病患者的標準化常模。樣本是由700名不同層次的正常成年人,390名兒童和青少年,320名精神分裂癥患者,315名住院的抑郁癥患者,440名門診患者,180名性格障礙患者組成。但是,綜合系統(tǒng)的樣本標準化也不斷遭到Lilienfeld和Wood等人的質疑。他們對以下幾點提出批評:很多正常成人和兒童,若根據CS的標準化樣本,卻被診斷為異常;正常人樣本中有精神病患者;不同文化和民族間的標準化樣本應該存在差異;病理特征的標準應隨時間的不同而變化;不正確的施測導致了標準化樣本的差異。
Exner認為CS中的正常人數據與Shaffer等的正常人數據之間存在著差異,部分是由于R的分布造成的,但x+%,X-%等重要記分的差異并不明顯。Exner認為Wood等人所說的RIM的標準化樣本誤導了診斷信息是過于夸大的,造成這一點是由于他們對此測驗和用法的錯誤理解造成的。Weiner認為,Exner標準化常模比其他大多數心理測驗的常模標準化程度更高。但羅夏的常模也確實存在缺點,最主要問題是缺少對少數群體的研究。
4 RIM的應用
4.1 目前在國外的使用情況
RIM一直是臨床心理學界用得最多的測驗之一。如Piotrowski和Keller對413個心理門診的調查發(fā)現80%以上的機構用RIM。Watkins等人對412名臨床心理學家的調查也發(fā)現,82%以上的人說他們在評估中用RIM。使用率更多的方法是臨床訪談(95%),WAIS(93%),MMPI(85%)和句子完成法(84%)。而且綜合系統(tǒng)的測試標準是當今美國和西歐應用最多,也是在美國大學中被講授最多的方法。1997年,美國心理學協(xié)會專業(yè)事務委員會授予Exner博士杰出專業(yè)貢獻獎。這說明RIM得到美國心理學協(xié)會的公開承認。美國心理學協(xié)會專業(yè)事務董事會把RIM看作至今唯一一個最具實力的心理學測量工具(1998)。
在美國,羅夏墨跡測驗除用于心理咨詢與治療領域外,在臨床心理學的其他分支領域的應用也十分廣泛。以司法心理學應用為例,據統(tǒng)計,在1945至1995這五十年間,有247起案件的審理引用了羅夏測驗的結果,平均每年5起。在這247起案件的審理過程中,除有26起對測驗的信度和效度提出疑問(占10.5%)外,其余案件均認可羅夏測驗的結果可靠并且有效。
比如,詐病是司法鑒定中一個重要問題,Crawford的研究指出綜合使用MMPI-2效度量表和RIM的戲劇性特殊分數(DSS是B1、Fi、Ex、Sx、MORO1AG的和)來評估詐病,比單獨使用兩種測驗更加有效。研究對象為55名偽裝患有抑郁或者背痛的臨床心理學研究生(對照組),和經精神病測試程序診斷為抑郁和疼痛的44名詐病患者(目標組)。研究采用正報率和誤報率(TPR&FPR)作為效度指標。聯合使用MMPI-2的裝壞量表(FBS)和RIM戲劇性特殊分數DSS,可以得出最精確的TPR和FPR,而且能夠在逐步線性回歸模型中解釋40%的詐病分數變異。其它常規(guī)的MMPI-2效度指數,如F家族量表(F,FB,F(p)和其它RIM變量不能夠預測詐病,或提供TPRIFPR可接受水平。
Bonieskie研究了兒童監(jiān)護訴訟當事人與其他病人和非病人群的差異。結果表明兒童監(jiān)護訴訟當事 人與正常人常模數據和大學樣本比較,在羅夏Y,m,AG,COP,WSUM6和X+%變量上顯著不同。這說明他們在決策和判斷力上存在問題。他們采用非常規(guī)的觀點看問題并且容易忽視一些重要信息,從而導致無效的問題解決。同時他們AG和COP分低,CDI陽性,表明他們在人際互動中的消極態(tài)度,及應對和社會交往能力的欠缺。這些特征極有可能使他們作為父母不能確定什么是他們的孩子最需要的,從而不能盡到監(jiān)護人的責任。這一結果對法庭訴訟,及通過法庭對監(jiān)護關系的干預都是重要的。
4.2 在心理疾病診斷和治療中的作用
羅夏本人認為RIM的最基本和最重要的用途是心理異常的診斷。他認為RIM不僅是一個測驗,還是實驗可以依據的工具。這個工具能對智力遲緩者、精神分裂癥者和其它具有典型特征的群體進行鑒別。后繼的研究有很多支持了這一觀點。如Archer和Gordon、Hilsenroth等利用RIM證明了精神病患者會在語言表達上有缺陷并且經常做出形狀質量很差的反應。Hilsenroth等的研究還顯示出RIM可以對分裂型人格障礙者進行診斷。Exner發(fā)現精神分裂癥指標SCZI能夠鑒別出80%被DSM標準診斷為精神分裂癥的當事人,只有12%的來自其他心理障礙患者樣組或是正常人樣組的當事人被錯誤指認。自殺綜合指標S-CON可以鑒別出83%的自殺者。如果把想自殺的當事人按照自殺意愿的強度進行分類,則S-CON可以鑒別出92%的自殺意愿強烈者,并且只錯誤地將12%的住院抑郁癥患者和6%的精神分裂癥患者識別為想自殺者,但沒有一例正常的當事人被錯誤指認。
即使最尖銳的批評者Wood和Lilienfeld也承認羅夏記分不是隨機的和沒有意義的:“精神分裂癥患者,雙極障礙患者(bipolar disorders)、邊緣性和分裂型人格障礙者在RIM中易于作出更多的不正常的語言反應,表現出差的形狀回答,在“思維障礙指數”等幾個與特殊分有關的指數上的得分將不同。
多數人認為,RIM的使用者如果具備非常的經驗和技巧,就能從測驗中得到大量信息,這些信息對疾病的診斷和治療都有重要的意義。
4.3 在特殊兒童研究中的應用
4.3.1 在注意缺陷多動障礙(AD/HD)中的研究 RIM的研究能夠在很大程度上揭示AD/HD兒童的認知和人格特征,幫助制訂相應的干預措施。如Cotugno等發(fā)現AD/I-ID兒童在羅夏變量Lambda、Shading、X-%、Xu%、CDI、DEPI等顯著性高于對照組;而SUMC、Afr、egocentricity index、COP、純H、AG、常見回答P、Xo%、特殊分數Sum6、加權特殊分數WSUM6則顯著低于對照組。揭示AD/HD兒童存在顯著的應對缺陷和信息處理、自我和人際知覺、情感表達及思維能力的障礙[32]。Bartell發(fā)現AD/HD兒童有較少的人類運動回答M,低的經驗平衡EB(關系到利用資源時的一種心理風格或偏好)和高的歪曲形狀X-%。對立和非對立型AD/HD兒童中則存在人類回答頻率的顯著差異。Strickland的研究發(fā)現AD/HD男童在避免復雜性(高L),避免問題解決風格,缺乏應對技巧(CDI),低自尊(自我中心指數低),情感回避(低Afr)和人際知覺困難(較少的COP AG H,T),較差的現實知覺(PTI和P少),而且有抑郁情緒易感性(DEPI高)。一個未預料到的結果是有38%的顯示出一種過分卷入的應對風格。
4.3.2 在兒童學習障礙中的應用
Acklin等研究了兩類學習障礙(言語能力障礙和空間能力障礙)兒童的羅夏特點,發(fā)現學習障礙兒童表現出感知準確性差,信息處理和問題解決的低效率,逃避情感刺激,及自我知覺不準確等問題,表現在x+%、F+%、X-%、zd、DQ+、DQv/+、WSUM6、Aft及自我中心指數上有顯著差異。Rodriquez,Sutil的研究也發(fā)現西班牙學習障礙兒童在感知精確性、自我概念等方面顯著性低于對照組兒童。
4.3.3 天才與非天才兒童的比較研究
Wideman對比了來自5所公立小學4~5年級的30名天才兒童(IQ平均值為132,73)和30名非天才兒童(IQ在90~109之間,平均值為102.8)。結果發(fā)現天才組兒童認知卷入程度明顯高于非天才兒童(即L值更低),天才組內向(表現為EB左邊高于右邊)人數顯著高于非天才組,而中間型則顯著少于非天才組,天才兒童的反應更復雜(表現為混合決定因素Blends更多)。兩組的精神分裂癥指數SCZI差異不明顯。
4.3.4 在其他兒童心理障礙中的應用
羅夏測驗在其他的兒童精神障礙的診斷和干預研究中也得到廣泛應用。Holaday等的研究表明Asperger綜合征兒童的合作性運動COP、紋理回答T、人類運動回答M、人類回答H、加權彩色回答WSUMC、現實經驗EA等顯著低于常模,而應對欠缺指數CDI和持續(xù)或綜合錯誤的回答顯著高于常模。從而支持了DSM-IV對于Asperger綜合征的診斷,即人際交往的異常,貧乏的社交關系和社交無能,弱的情感表達及建立和保持親密關系的缺失。
Weber發(fā)現品行障礙兒童的紋理回答T和純人類內容H顯著為低,而彌漫陰影回答得分高,顯示品行障礙兒童具有低的人際依戀和對他人興趣缺乏、高焦慮等人格特點。
5 對爭論的評價
5.1 如何看待關于RIM的爭論
從上文的論述可以發(fā)現,有很多研究證明RIM的心理測量學性能并不比其他心理測驗低。但為什么還有那么多批評呢?我們認為其主要原因是批評者對RIM存在誤解。RIM的總體效度并不優(yōu)于其他測驗,再加上其使用成本高,施測費時費力,解釋不易避免主觀性等原因,導致一些學者的堅決反對。除批評者的原因外,RIM本身也存在問題,主要有:
(1)RIM的應用價值被支持者不現實地夸大,進而被誤用和濫用。RIM的臨床效度是較好的,但不是每個記分都有效度。很多記分只有在一定條件下才有意義(比如有的記分只適用于特定的人群,有的記分只有在其他記分超出正常范圍時才能代表某種特征)。RIM提供的信息量比普通的心理測驗大得多(有100多個記分,還有內容分析等信息),使用者往往希望盡可能多地從測驗結果中得出結論,卻忽視了科學的原則。
(2)很多RIM的使用者并沒有完全遵守綜合系統(tǒng)的測試原則與標準,其他RIM系統(tǒng)的記分和解釋標準仍然存在。這就使不同研究者的結論缺乏一致性,導致研究結論不能重復驗證。從而招致反對者的批評。
(3)很多RIM的使用者并沒有受過專業(yè)訓練,實際上,很多研究者采用學生做主試,這些人根本掌握不了復雜的施測和解釋技巧。Meyer和Wood 等一致認為:臨床心理學家們沒受過專業(yè)訓練就使用RIM,那么結果是很危險的。任何需要復雜的施測、記分和解釋原則的測驗都是如此。當研究者沒有充分地理解RIM和它的心理測量學原理及使用要求時,所得出的結論往往是片面的。
5.2 如何認識RIM的,bN測量學性能
RIM信度(包括評分者信度和重測信度)基本上是沒有問題的。多數變量的信度系數符合心理測量學標準,只有少數與狀態(tài)性人格特征有關的變量信度低于0.70。爭論的焦點是其效度。RIM受到批評的主要原因是多數變量與效標的相關不高。造成這一問題的原因有:(1)效標本身可能并不可靠,即效標測量也存在信度和效度的問題。在臨床診斷和人格評估中迄今還沒有完全準確的效標。(2)RIM與其他心理評估工具測量的內容并不相同。多數效標來自口語報告,所描述的多數是外顯行為的差異,而RIM主要測量內隱的和長效行為。(3)RIM記分通常不具有獨立解釋意義,只有與其他記分結合起來,才能代表某種心理特征。
另外,依據單個RIM常常容易得出錯誤的結論,對測試結果必須整體地、綜合地分析。同時還要參照來自其他測驗的信息,以及面談、個人病史等資料。例如Parker等人通過元分析研究,發(fā)現如果使用RIM的綜合指標,測驗的臨床效度可以達到0.46,甚至高于MMPI(其效度為0.41)。
5.3 如何看待RIM的使用價值
RIM是一個很復雜的測試,但為什么許多人還對此測驗情有獨鐘呢?原因在于,RIM是一個非結構化的、非文字的心理測驗,而且在一定程度上可以被當做投射測驗。它能有效地避免意識的審查和偽裝,從而能對人無意識中表現出的感知能力、思想過程、需要、動機和沖突進行評估,能對人的間接行為(被試對墨跡圖的間接反應)給予解釋,獲得關于個體心理特征的豐富信息。而這些信息常常是其他測量工具所不能發(fā)現的。很多研究表明RIM在心理疾病診斷和外顯行為預測方面有增值效度。
RIM能有效地測到被試的經驗和世界觀,自我及人際知覺。例如,兩個被試在MMPI上的得分模式一樣,都是2、4、8量表高分,但是被試A在RIM中的病理內容(MOR)和危險內容記分多,而被試B的記錄中有2個鏡像反應且攻擊內容多,對這兩個被試病因的分析和治療措施的選擇就有相當大的差異。被試A是一個具有抑郁和焦慮情感的人,過多知覺到現實世界中的危險,表明他有心理創(chuàng)傷或受過傷害。被試2則可能是病態(tài)自我中心的人格障礙或攻擊性行為人格障礙。
RIM也能有效地檢測出被試感知覺的精確性和現實性。一個被試可能在面談和自陳式測驗中表現良好,尤其在社會習俗方面,但他的思維和知覺障礙卻可能在RIM中體現出來。在評估思維障礙的程度和內容上,RIM優(yōu)于其它經常使用的評估工具,綜合系統(tǒng)的特殊分能對不同思維問題進行分類。RIM在評估情感經驗、情緒表達和控制、壓力耐受和控制等方面也很有用。
RIM中包含了關于個體心理特征的豐富信息,雖然這些信息也能通過其它的外部行為來表現。例如,朋友或親戚所觀察到的行為,正式訪談所記錄的行為,他人仔細觀察或深入訪談所得到的外部行為,通常是很準確的。但是這些外部行為卻不能體現其心理過程,而RIM的結果能體現這樣的信息。這些信息往往是非常重要的。
5.4 使用RIM時應注意的問題
5.4.1 知道測驗能做什么不能做什么
RIM并不能測試所有心理特征,在心理疾病診斷方面,有時它并不比其他心理測量工具更精確。與其他心理測驗一樣,RIM也有其長處與短處,應該與其他測驗相互補充。RIM主要測量三方面內容:(1)內隱動機(如不能直接表達的需要狀態(tài));(2)認知、感知風格(如習慣用哪種方法感知和加工信息);(3)應對風格(耐壓性和應對資源)。這三方面的信息不能通過口頭報告、問卷法和訪談法而獲得。因此許多臨床學家認為把RIM與其他測驗結合使用能更全面地了解人的心理功能。
5.4.2 RIM的優(yōu)勢在于測量內隱人格變量
用投射測驗(如RIM和TAT)與自我報告(如訪談和問卷)測量同一種構念,測量結果間往往不會有高相關。原因是這兩種方法測量了這種心理學構念的不同側面。事實上投射法與自我報告法存在高相關,那么投射測驗就不重要了,用訪談法就可以得到的為什么還用墨跡圖來研究呢?McClelland,Koestner,Weinberger指出:內隱動機的測量結果(例如RIM和TAT)能對未知情境中的自發(fā)性行為加以預測,RIM方法比自我報告方法能提供動機和情緒方面的更直接信息,因為自我報告所提供的許多信息因為受到意識的審查和自我監(jiān)控的影響而沒有表達出來。
RIM中的其他記分如應對指數、感知或認知功能指數都具有這一特征。如研究者用口唇依賴量表(ROD)對心理的應激狀態(tài),自發(fā)尋求幫助的行為進行測量,發(fā)現ROD量表比自我報告法更能預測無意識過程的間接表現。就是說,如果我們要研究受內在動機驅動的行為或長期行為,則最好選用RIM、TAT類的投射測驗。
5.4.3 主試必須接受專業(yè)訓練,在嚴格指導下測試RIM
施測過程對任何一個測驗都非常重要,對RIM來說更是重中之重,主試在施測中所做出的任何判斷都會影響記分。RIM測試中主試的詢問起著至關重要的作用。主試在測驗中很可能忽略被試反應中的某些關鍵詞,詢問不充分,詢問的問題過多或過少,問了些不合適的問題。口語記錄也很關鍵,主試很可能忽略某些相關的信息,或者使信息進行了錯誤的重組等等。這些問題在記分中不能被更正過來就會影響許多記分。我們可以用一個例子來說明詢問的重要性,Adriana Lis和她的同事在搜集意大利人的樣本時,第一次沒有用標準的詢問程序,結果發(fā)現成年人(N=101)樣本和青少年(N=51)樣本記分都明顯不同于Exner的標準化樣本,修訂時對主試進行了標準化訓練,新樣本資料才與Exner樣本趨于一致。這說明對施測的質量和詢問進行系統(tǒng)監(jiān)測的重要性。
5.4.4 了解RIM的適用條件,合理設計研究
RIM是一種投射測驗,在研究設計中要考慮這個測驗本身的特點才能發(fā)現有用的結果。首先要選擇合適的效標。當用RIM和其他測驗對同一構念進行驗證時,應采用多標準多方法。其次,在評估測驗的結果時,應考慮RIM本身的局限性,而不是用RIM解決所有問題。再次,當把投射測驗結果與自我報告的結果進行對比時,應多用實驗的數據而不僅僅用相關的數據。
6 結論
從以上我們對不同時期元分析研究的總結,可以看出RIM的信度和效度并不低于其他心理測驗。RIM與范圍廣泛的外顯行為指標都有一定程度的相關性。但RIM的效度隨效標的不同而有相當大的變化,如RIM對精神病的鑒別效度可達0.46,與依賴性行為的相關達0.37,而對抑郁癥的鑒別效度只有0.12。這說明在不同條件下RIM的效度很不一致,但這不是RIM獨有的問題,其他測驗如MMPI、WAIS等也存在同樣的問題。因此,至少從已發(fā)表的研究中能證明RIM是有效的。我們建議臨床心理學工作者使用RIM。
在整個心理測驗領域,投射測驗所面臨的批評要多于客觀類人格測驗,RIM也不例外。但RIM是標準化程度最高的投射技術,也受到了最嚴格的檢驗。投射技術是為了克服問卷法的缺點而提出的,RIM在這方面可以說取得了相當大程度的成功。即使它本身存在問題,這些問題還不足以否定它的價值。在更有效的測量工具開發(fā)出來以前,應繼續(xù)倡導這一測驗技術,去研究復雜的人類心理現象。應特別強調的是,RIM是一個復雜的測量技術,在使用時必須遵守科學的原則,但經驗和技巧也起著非常重要的作用。
我國老一輩測量學家龔耀先先生在1980年代就對RIM進行了標準化工作,龔先生及其合作者發(fā)現精神分裂癥患者有許多與思維障礙有關的特殊回答,感知精確性顯著低于正常人,較少自我關注,因此使用RIM有助于精神分裂癥的診斷和鑒別。以后又有學者研究精神病患者的攻擊性反應和客體關系等,但與國外相比,國內的研究還很薄弱。在心理健康問題越來越受到重視的今天,心理學和精神醫(yī)學工作者應該大力加強對包括RIM在內的投射技術的研究。
相關熱詞搜索:墨跡 爭論 近期 羅夏墨跡技術的近期發(fā)展與爭論 羅夏墨跡技術的構念效度 羅夏墨跡圖及分析
熱點文章閱讀