反饋負波及其理論解釋|第五波理論
發(fā)布時間:2020-03-03 來源: 美文摘抄 點擊:
摘要:反饋負波(feedback related negativity,FRN)是由代表行為錯誤或失去金錢等負性反饋刺激誘發(fā)的一種腦電波成分,出現在刺激呈現后250~300ms左右,偶極子源定位發(fā)現這一成分產生于前扣帶回附近。對于FRN的功能意義的解釋主要有強化學習理論和情緒動機假說,前者認為FRN反映的是神經系統(tǒng)對反饋刺激的認知加工過程,而后者認為FRN反映的是對情緒動機意義的評價過程。兩種理論框架下還有一些目前研究仍待解決的問題,可能是未來研究的方向。
關鍵詞:反饋負波,強化學習理論,情緒動機假說,前扣帶回,事件相關電位 分類號:B841
人們總是在行為的過程中不斷地利用外界反饋刺激的信息來監(jiān)控自己的行為,及時發(fā)現自己的錯誤,然后進行動作調整。近年來,對反饋刺激引發(fā)的反應的研究成為認知神經科學研究的熱點之一,借助于新的技術手段,可以更加深入地去了解結果反饋刺激引起的內部神經活動及其功能意義,這不僅具有心理學理論意義,同時對于人類工程學及相關學科也有現實的應用價值。事件相關電位(eventrelated potentials,ERP)的研究發(fā)現,反饋負波(feedback related negativity,FRN)是人腦加工反饋刺激最重要的相關腦電成分,它的源定位在ACC附近。與其他的事件相關成分相比,FRN有其自身的特點。已有的理論似乎又不能解釋所有的結果反饋刺激誘發(fā)的腦電波負向偏轉現象。本文在介紹了FRN現象的基礎上述評目前相關的理論解釋,目的是找到未來研究的方向。
1 FRN現象
FRN的研究是在錯誤相關負波研究的基礎上發(fā)展而來的。研究者認為人腦存在一個錯誤覺察系統(tǒng),及時發(fā)現錯誤,調整行為。在行為水平上,Rabbitt為人類這種錯誤覺察糾正系統(tǒng)提供了清楚的實驗依據,但其中的腦機制還不清楚。上世紀90年代初,研究者們在快速反應任務中,如Flankers任務,記錄被試的腦電波,發(fā)現在錯誤按鍵反應后100到150ms左右,腦電波會出現明顯的負向偏轉,于前中部的電極點上達到峰值。這一成分Falkenstein等人稱之為(error negativity,Ne),Gehring等稱之為(error-related negativity,ERN),這就是錯誤相關負波。
在這種快速反應時任務中,被試在按鍵之前就知道了正確的反應應該是什么,因此,只要被試按鍵后馬上就能察覺到自己是否錯誤,然而,在有的實驗任務中被試不能立刻知道自己是否做出正確的反應,只能依靠外界信息的反饋。Miltner等人在1997年研究了被試在時間估計任務中對結果反饋的事件相關腦電位,發(fā)現伴隨著不正確結果的反饋,腦電波也產生了負向偏轉。Milmer等人認為這一成分跟錯誤相關負波一樣,可能反映的是錯誤覺察的過程。后來的研究者也稱之為ERN或feedbackERN,簡稱為FRN。在本文中,為了區(qū)別起見,由錯誤按鍵反應誘發(fā)的相關負波,即response-lockedERN都稱之為ERN,如圖1;凡是由反饋刺激誘發(fā)的負波,即feedback-locked ERN都稱之為FRN,如圖2。
對FRN進行偶極子溯源分析發(fā)現,腦電波頭皮分布定位在前扣帶回(anterior cingulated cortex.ACC),可能包括輔助運動皮質在內的區(qū)域。后面的研究也認為是在內側前額葉部分(medial-frontalcortex,MFC)。
2 FRN研究的實驗范式
在FRN的研究中主要用到的任務是時間估計任務和簡單賭博任務。時間估計任務的實驗過程是首先給被試一個聲音的提示表示計時開始,然后讓被試來估計一秒鐘的時間,如果感覺到了一秒鐘就按鍵停止計時,間隔1秒后呈現反饋刺激告訴被試前面對時間的估計是否正確。一般被試估計的時間在一個時間段內,都算正確,并且正確的標準會根據被試前面試次的表現進行實時的調整。實驗證明,不同的感覺通道呈現的負性反饋刺激與正性反饋刺激相比都引起了更大的電位偏轉。
簡單賭博任務一般是要求被試在電腦程序上進行類似賭博的游戲,每一次的輸贏都會累加到被試最后的報酬中去。Gehring和Willoughby記錄人們玩賭博游戲時的腦電活動,讓被試在屏幕上呈現的一個表示5美分和另一個表示25美分的兩個卡片中進行按鍵選擇,隨后被試選擇的卡片被圈起來,以幫助被試確認自己的選擇。一段時間后,反饋刺激出現,卡片變了顏色,紅色表示輸錢,綠色表示贏錢。簡單賭博任務也有其他的變式,例如有的賭博任務是在屏幕中呈現四張撲克牌(不同花色的Ace),被試的任務是進行按鍵選擇,猜測哪張撲克牌接下來會保留在屏幕上,四個不同的按鍵分別對應四張牌。被試選中的那張牌會突出呈現出來,幫助被試確認自己的選擇,緊接著呈現代表反饋刺激的那張牌,如果被試猜測正確則會贏錢,否則會輸錢。被試不知道的是,輸贏的結果都是由計算機決定的,輸贏的概率差不多。
在這些不同的任務中都可以觀察到FRN這種成分,但這兩種任務范式都有各自的優(yōu)缺點:在時間估計任務中,被試可以根據結果的反饋調整自己的反應,不斷學習,因此更加符合現實生活的情境,但練習效應的存在和必須控制正負反饋比例的要求始終有矛盾。賭博任務的優(yōu)點是把被試每一次的表現都和最后的酬勞聯系起來,這樣增強了被試完成實驗任務的動機,缺點是,一般輸贏都是由電腦程序來控制,反饋不能提供真實的信息,而有研究認為負性事件對于學習和行為的改變非常重要,正負反饋與行為正誤保持一致才能符合以下將要闡述的強化學習理論的預期。
另外,在其他的一些實驗任務中也可以觀察到類似于FRN的腦電成分。Papo等人在一個假設檢驗的范式中,首先給大學生被試呈現三個阿拉伯數字,讓被試在心中形成一個關于這三個數字的潛在的規(guī)則,隨后呈現其他的幾組數字,被試可以連續(xù)檢驗自己的假設是否在這些數字中存在,并可以通過反饋刺激得知假設是否正確,從而修正這個假設。檢測反饋刺激的事件相關電位成分,發(fā)現在所有的電極點上,正負反饋都有差異,代表不正確反應的負性反饋刺激在類似P300成分前誘發(fā)了負向偏轉,這種負向的偏轉可能就是一種類似FRN成分。
3 FRN的理論解釋
從Miltner等人首先在時間估計任務中發(fā)現FRN現象開始,對于FRN現象內部的神經機制的探討越來越多,目前主要理論解釋是強化學習理論。另外最近有研究者開始強調FRN反映的情緒動機意義,這種觀點被稱為情緒動機假說或情緒理論。強化學習理論主要的觀點認為FRN是在神經系統(tǒng)對反饋刺激的認知加工過程中產生的,而后者認為FRN是對反饋刺激的情緒動機意義的評價過程中產生的。
3.1 強化學習理論
Miltner等人認為這種錯誤反饋誘發(fā)的負偏向可能反映的是一個錯誤覺察機制。這種機制不局限于特定任務和特定的錯誤,可以由對不同的錯誤處理而激活,如選擇反應時任務中錯誤的選擇、Go-NoGo任務中錯誤的動作、或在他們研究中錯誤的時間估計等。Holroyd等人發(fā)展了Milmer等的觀點,他們認為錯誤相關負波是當負性強化學習的信號通過中腦多巴胺系統(tǒng)傳輸到ACC時產生的,并且這種信號被ACc用來調整當前的行為。具體的過程是:基底神經節(jié)參與評價當前的事物,如果錯誤的行為反應造成的當前事件比期望差,多巴胺神經細胞就會引起相位減弱的活動,多巴胺系統(tǒng)將這些信息傳輸到ACC,由于多巴胺能的減弱不能抑制ACC上神經元的活動,此時就產生了較大波幅的腦電負波,如果當前事件比期望的要好,中腦多巴胺神經細胞就會引起相位增加的活動,此時在ACC上就不能產生腦電負向偏轉;咨窠浌(jié)就把這樣兩種信息分別利用并調整對下一次結果的預期,因此系統(tǒng)就逐漸地學會對獎賞和懲罰的早期預警。同時,多巴胺信號都被用做強化學習的信號傳輸到前額葉運動皮層,尋求合適的行為的調整。
對于這幾個不同的認知加工階段,都有很多直接或間接的實驗支持。本文從以下方面闡述了關于這個理論的實驗支持。
第一,評價系統(tǒng)是按照二元分類的規(guī)律來將當前的事件分成“好”和“壞”兩種結果。研究發(fā)現,FRN相關的評價系統(tǒng)對輸贏的具體數量不敏感,而是將所有可能的結果分成好與不好兩種情況。類似地,Holroyd等系統(tǒng)地研究中性反饋刺激誘發(fā)的ERP波形,中性反饋刺激表示的是不具有獎勵或懲罰的意義,也不反饋被試是否反應正確或錯誤,發(fā)現中性反饋刺激同負性反饋刺激一樣也誘發(fā)了腦電的負向偏轉,這種結果與最近關于產生FRN的評價系統(tǒng)將反饋分成滿意或不滿意的兩類的觀點一致。
第二,FRN的波幅取決于期待與事實之間的差別。神經系統(tǒng)對當前事物的評價是依賴于背景的,對結果的評價是好是壞是基于當前情境中能得到的各種可能的結果而言的,因此系統(tǒng)會在不同的情境中形成不同的期亡望。例如贏1000塊錢相當于贏500塊是好的,但相當于贏2000塊就是不好的結果。另外,Holroyd等人按照強化學習理論的推斷,期望越強的條件下負性反饋刺激會引起更大的波幅,他們認為獎懲刺激的頻率將會影響這一系統(tǒng)對負性刺激的認知。他們設置了兩種實驗條件,一種是懲罰概率小,另一種是懲罰概率大。結果發(fā)現,低懲罰概率的情境下懲罰這種負性反饋刺激引起的波幅明顯比高懲罰概率下的要大,從而證實了實驗的預期。
第三,人們在強化學習過程中對正負強化刺激信號具有偏好。在Frank等人的一項研究中,讓30名帕金森病人與19名正常被試同時去完成“trial-and-error”任務,發(fā)現帕金森病人對正性結果更加敏感。后續(xù)研究發(fā)現,有的人傾向選擇正性的結果,這類人FraIlk等稱之為“positive learner”,他們在遇到兩個能帶來正性反饋結果的概率差不多的選擇時,會產生更大的FRN,相反的,有的人盡量避免負性的結果,這類人被稱之為“negative learner”,他們在面臨都可能帶來負性結果的選擇時,會產生更大的FRN。這些研究證實了認知強化學習中存在動態(tài)的多巴胺系統(tǒng)的模型,同時也說明這種FRN可能反映了被試從錯誤反應中學習比從正確反應中學習多多少的程度和決策沖突的大小。
第四,系統(tǒng)利用內部或外部的信息進行學習的過程可以反映在ERN和FRN的波幅上。很少有研究把由錯誤覺察引起的ERN和負性反饋誘發(fā)的FRN兩種成分放在一起進行對比,Holroyd等人在同一個實驗中研究了兩者的關系。他們設置了一個“Probabilistic Learning”的任務:六張卡片隨機呈現多次,讓被試在兩個鍵中進行選擇按鍵反應,按對了鍵就會贏錢。實際上六張卡片中有兩張分別100%對應其中一個按鍵,還有兩張卡片分別50%地對應其中的一個按鍵,另外,無論被試按哪個鍵,第五張卡片始終會輸錢,第六張卡片始終會贏錢。實驗的結果如Holroyd等人的預期一樣,在實驗的開始階段,被試沒有掌握任務的規(guī)則,所有的負性反饋刺激都誘發(fā)了FRN,但隨著實驗的進行,被試逐漸學會了規(guī)則。在卡片和按鍵100%對應的情況下,按鍵本身就決定了輸贏,因此錯誤按鍵產生的ERN波幅越來越大,而負性反饋產生的FRN波幅變小:在卡片和按鍵50%對應的情況下,被試需等待反饋信息決定反饋的結果,負反饋會持續(xù)產生FRN。而在卡片始終贏或始終輸的情況下,無論是反應還是反饋都不能產生負向偏轉的腦電位。由此可見,強化學習理論中認為多巴鞍的活動產生了ERN和FRN,并且整個系統(tǒng)覺察錯誤、利用信息進行強化學習、調整行為是一個動態(tài)的過程,本實驗中ERN和FRN的波幅的變化證實了這樣一個動態(tài)系統(tǒng)的存在。但利用內部和外部的信息來進行行為的監(jiān)控和調整是否共用相同的腦機制在其他的研究中還存在異議。
3.2 情緒動機假說
強化學習理論對于結果FRN的認知功能的解釋被許多實驗所證實,并且已經建立了計算模型。但最近一些研究者認為FRN可能反映的是對錯誤的行為或者負性反饋引起的情緒動機意義的評價。并且對于FRN的發(fā)生源,前面研究都比較一致的認為在ACC及附近,而ACC不僅與認知過程有關,同時也與情緒功能的關系密切,它對于人們評價行為的好壞非常重要。
Gehring和Willoughby的實驗中,要求被試完成一個簡單賭博任務,被試在兩個可選擇的籌碼“5”和“25”中做出選擇,同時對輸贏的結果給予反饋,發(fā)現輸錢的負性反饋誘發(fā)了FRN,Gehring等稱之為前額葉負波(medial frontal negative,MFN)。實驗的結果說明了FRN反映的是對得失的敏感而對反應的正確錯誤不敏感,同時發(fā)現被試在輸錢后更加傾向冒險,這些都與強化學習理論相矛盾,因此他們認為前扣帶回的活動不是對每一次行為的評價而是對行為造成的結果引起的情緒動機意義的快速評價。Nieuwenhuis等人質疑了Gehring和Willoughby的這個研究,認為他們在實驗程序中用顏色突出了結果的輸和贏,因此FRN對金錢的得失敏感,而對行為是否對錯不敏感。Nieuwenhuis等改進了實驗程序,在不同的實驗程序中分別用顏色突出了金錢得失因素和行為正誤因素,跟實驗假設相吻合,FRN對利益敏感還是對反應敏感取決于哪個部分被強調,但是他們認為改進的研究仍然不能回答FRN是否涉及情緒動機的加工過程的問題。
支持情緒動機假說的還有其他的一些研究。如果按照強化學習理論的觀點,FRN反映的是系統(tǒng)監(jiān)控當前執(zhí)行的動作行為的一個學習的過程。那么FRN只會在被試有實際行動時才產生。而如果認為 FRN是ACC對當前事件的一個評價的過程,那么不管有沒有實際的動作,都會產生FRN。Yeung等人利用一個不需要被試進行反應任務,結果發(fā)現在被試沒有做出反應但表示失去金錢的反饋刺激也產生了FRN這種腦電波成分,類似的研究也得到了相同的結論?梢夾CC不僅是對前面行為的學習的功能,還有對獎賞或懲罰的反饋結果的動機意義的處理功能。這時的FRN波幅相比需要被試進行按鍵選擇的任務中要小,Yeung等認為這是由于被試的主觀參與實驗的程度有關系,說明動機因素可能影響了FRN的結果。
另外如果認為FRN就是ERN的一種,那么有很多的研究證明ERN跟情緒、人格、動機因素有關。據此,可以推斷,FRN也會受到情緒,動機以及人格變量因素的影響。Masaki等的研究就提到情緒動機影響FRN。
4 目前研究未解決的問題
4.1 兩種理論的爭論
FRN反映的是認知加工過程本身還是對認知過程所產生的情緒評價是上述兩種理論爭論的焦點。但兩者都有一個共同的觀點認為FRN起源于ACC。早在2000年,Bush等綜述了大量的涉及ACC的功能定位的實驗報告,得出結論,認知任務和情緒任務分別激活了ACC不同的分區(qū)。ACC的喙部(rostralanterior cingulate codex,rACC)主要跟情緒活動有關,而ACC的尾部(caudal anterior cingulate codex,cACC)主要在認知任務中活動較強。但最近Davis等報告了一個采用單細胞記錄技術的研究,認為ACC的這種認知與情緒的分區(qū)可能會更復雜,各部分的功能不是獨立的。因此起源于ACC的FRN反映的僅僅是察覺錯誤的認知過程,還是對由于錯誤或者失去金錢的結果產生的情緒的加工很難從源定位和成像的角度找到直接的根據。Yeung的觀點是認知理論和情緒理論應該是相互補充而不是互相矛盾的。甚至Nieuwenhuis等認為行為監(jiān)控等認知過程和在此基礎上產生的情緒意義評價可能復雜地交織在一起,很難分離開。如果事實如此,那么一種選擇是認為FRN到底反映的是認知加工過程還是情緒加工過程的爭論沒有意義,另一種選擇是對于這種爭論還需要使用更加精密的技術,進行更為精確的研究。
4.2 FRN是否與ERN反映的是相同的神經活動過程
近年來關于FRN的研究相對較多,而對ERN的研究相對較少,一些研究者籠統(tǒng)地將FRN也歸為ERN其中的一類。但許多的研究并沒有正面的回答這個問題:兩者是否是同一回事?Miltner等認為時間估計任務中產生的FRN和ERN的是相似的,因為兩者都是由錯誤的反應誘發(fā)的腦電成分。一些偶極子定位和磁共振的研究也發(fā)現兩者都起源于內側額葉,可定位于ACC及附近區(qū)域。但Yeung等人研究中沒有錯誤反應但負性反饋刺激也能得到FRN,這顯然與快速反應時任務中的ERN成分有很大的差別。同時,一項研究表明,FRN和ERN的源定位是不一致的,系統(tǒng)利用內部或外部的信息進行行為的監(jiān)控和調整可能是不同的神經活動過程。由上可見,FRN與ERN是否反映的是相同的神經活動過程還值得探討。
4.3 FRN是否反映的是沖突檢測的過程
Holroyd等人的觀點是ERN和FRN一樣都反映的是錯誤的覺察過程。而一些研究提出了關于ERN的另外的一種理論解釋:沖突檢測理論,這一理論是由Carter和VanVeen等人提出的,他們認為ERN反映的不是失匹配而是反應表征之間的沖突。按照這種理論的推斷,當錯誤反應與正確反應高相似時ACC活動增強,為了驗證此理論,Gehring和Fencsik研究了反應相似性和沖突對ERN的效應,利用包含手和腳的運動的任務,結果ERN在錯誤反應與正確反應高相似沖突較強時波幅較大,這結果支持了沖突檢測理論。
據可查閱的文獻,很少有研究認為FRN也涉及到沖突檢測過程,除了Jia等人最近報告的一個研究,實驗過程是首先在屏幕中間呈現一個顏色塊(紅或綠),然后讓被試按鍵猜測接下來出現的顏色塊是否跟這個顏色塊的顏色一致,接著呈現反饋的顏色塊(紅或綠),如果被試猜測正確,則被試會贏錢,如果猜錯則會被罰錢。隨后要求被試再次按鍵確認自己是否猜對。跟大多數研究結果一致的地方是,當被試猜測錯誤,失去金錢時觀察到了FRN,但有趣的是無論被試輸或贏,當前后兩個顏色塊的顏色不一致時也觀察到了FRN,在這里知覺沖突的主效應明顯。這個結果顯然是目前的理論難以解釋的,還需要新的研究來證實FRN是否跟沖突檢測有關聯。
4.4 FRN是否能反映社會情緒加工過程
前面的研究發(fā)現,讓被試觀察他人在快速反應時任務中犯錯時,也能得到負向偏轉的腦電位。在這個基礎上,Yu和Zhou在一個賭博任務中同時記錄了被試接受自己行為結果的反饋和他人行為結果的反饋的腦電。在兩種情況下都獲得了反饋相關負波或稱之為反饋相關類似的負波,說明相同的神經機制卷入了評價自己和他人行為的結果。同時Fukushima和Hiraki讓被試和實驗助手一起完成一個競爭性的賭博游戲,兩個人輪流進行賭博,自己贏則對方輸,自己輸則對方贏。結果發(fā)現,女性被試在感受他人失去金錢時也會被誘發(fā)前額葉負波,盡管自己能夠受益,而男性被試卻不會將別人輸錢當作負性反饋。Fukushima和Hiraki認為這種前額葉負波對社會情緒加工過程敏感,人們在復雜的社會情境中快速處理外界信息的神經活動出現了個體差異。
社會認知神經機制已成為認知神經科學的熱點問題,前面這些研究已開始將FRN這種腦電位跟社會認知聯系了起來,但是否可以利用ERP的技術手段去研究在更復雜的社會情境中的社會認知過程,還有待更進一步的證實。
5 結束語
從Milmer等人1997年的研究開始,關于結果反饋刺激的ERP研究已經有10年左右。目前這方面的研究取得了很大的進展,對于人腦加工負性反饋刺激最相關的FRN成分有了初步的認識。但是對于FRN的反映的神經活動過程不能形成統(tǒng)一的理論解釋,另外還有一些具體的問題當前的研究也不能很好地回答,對于未來的研究本文提出如下幾點建議:
第一,要開展對復雜反饋刺激的研究。通過對前面的研究發(fā)現,不同任務中反饋刺激一般包含兩個維度的信息:行為正誤和金錢得失。行為正誤這個維度指的是告訴被試是否做出了正確的反應,而金錢得失維度指的是反饋刺激僅僅提示被試是否贏錢,這兩個維度的信息在兩個研究中都加以了區(qū)分。許多的研究都是單獨呈現或單獨強調其中一個維度的信息,而人腦對于同時強調了這樣兩個維度信息的復雜的反饋刺激的加工過程還需要新的研究來探討。
第二,要考慮人格因素的作用。前已述及,FRN反映的神經活動過程是否涉及情緒動機因素還存在爭論,前人的研究大多采用被試內的設計,而很少考慮到被試之間的人格差異,因此將來的研究可以考慮采用不同的人格類型的被試來進行實驗。
第三,要注意反饋刺激的材料。不同的研究者對于FRN都有不同的理解,造成這個問題的原因可能是在前人的研究中采用了很多不同的實驗任務,而且對于反饋刺激的材料類型也沒有統(tǒng)一的規(guī)范。有的研究就表明反饋信息的復雜性會影響FRN的波幅,模棱兩可的反饋刺激會引起更大的負波?梢娫趯淼难芯恐,我們應注意反饋刺激的材料屬性和呈現方式等。
第四,要結合新的技術。想真正弄清楚FRN所反映的神經活動過程,對FRN這一成分進行精確的源定位是非常重要的,ERP技術雖然具有較高的時間分辨率,但空間分辨率相對不足,采用ERP的技術與高空間分辨率的磁共振,單細胞記錄等腦成像技術相結合的方法必將也是未來反饋刺激研究的趨勢。
相關熱詞搜索:波及 反饋 解釋 反饋負波及其理論解釋 負協同效應名詞解釋 本量利分析的名詞解釋
熱點文章閱讀