康曉光:作為內(nèi)生博弈規(guī)則的精英聯(lián)盟——關(guān)于當(dāng)前中國(guó)大陸政治結(jié)構(gòu)的博弈論解釋
發(fā)布時(shí)間:2020-06-02 來源: 短文摘抄 點(diǎn)擊:
一、問題的提出
在分析改革以來中國(guó)大陸的政治發(fā)展模式和政治穩(wěn)定問題的3篇文章中,我指出,20世紀(jì)90年代中后期,在中國(guó)大陸,市場(chǎng)經(jīng)濟(jì)體制已經(jīng)取代了計(jì)劃經(jīng)濟(jì)體制,為了支持市場(chǎng)的有效運(yùn)行,政府賦予公眾“消極自由”,相應(yīng)地,權(quán)威主義政治取代了毛時(shí)代的極權(quán)主義政治。
與此同時(shí),市場(chǎng)也造就了新的社會(huì)集團(tuán)并改變了各個(gè)集團(tuán)的相對(duì)地位。經(jīng)濟(jì)精英和知識(shí)精英崛起,進(jìn)入社會(huì)上層,而工人和農(nóng)民則淪入社會(huì)底層。制度和群體組成的變化對(duì)統(tǒng)治者提出了挑戰(zhàn)。他們必須重新回答“誰是我們的敵人,誰是我們的朋友”這一“統(tǒng)治的首要問題”。
統(tǒng)治集團(tuán)的回答是建立精英聯(lián)盟,即政治精英與經(jīng)濟(jì)精英和知識(shí)精英結(jié)成聯(lián)盟,而精英聯(lián)盟的機(jī)制可以概括為“行政吸納政治”。我還運(yùn)用這一模型解釋了這一時(shí)期中國(guó)大陸政治穩(wěn)定的原因,并分析了市場(chǎng)、權(quán)威主義政治和精英聯(lián)盟如何造就了威脅政治穩(wěn)定的因素。
在改革之前和整個(gè)改革過程中,政府始終保持了高度的自主性,也就是說,它沒有成為任何社會(huì)集團(tuán)的“俘虜”。它凌駕于所有集團(tuán)之上,對(duì)全社會(huì)實(shí)行權(quán)威主義統(tǒng)治。政治精英不但剝奪了大眾的政治權(quán)利,也剝奪了社會(huì)精英的政治權(quán)利。那么,為什么日益壯大的社會(huì)精英會(huì)接受或默認(rèn)這種權(quán)威主義政治秩序呢?這是因?yàn)榻y(tǒng)治集團(tuán)向他們提供了經(jīng)濟(jì)賄賂,甚至做出了適當(dāng)?shù)恼巫尣。通過掠奪大眾的經(jīng)濟(jì)利益并與社會(huì)精英分享掠奪成果,政治精英不但滿足了自己的利益要求,也滿足了社會(huì)精英額外的經(jīng)濟(jì)利益。這是社會(huì)精英同意放棄政治權(quán)利的根本原因!皠儕Z弱者,滿足強(qiáng)者”是精英聯(lián)盟的本質(zhì)。實(shí)際上,精英聯(lián)盟也就是分贓聯(lián)盟。
那么,精英聯(lián)盟是偶然的,還是具有某種必然性?是統(tǒng)治者強(qiáng)加于社會(huì)的,還是所有參與者共同締造的?是統(tǒng)治者愚民政策的成果,還是在完全信息環(huán)境中所有參與者共同選擇的結(jié)果?是人為的設(shè)計(jì),還是自發(fā)的秩序?是穩(wěn)定的,還是不穩(wěn)定的,而失去穩(wěn)定的條件又是什么?本文將運(yùn)用博弈理論探討上述問題。我將在Weingast和青木昌彥的研究成果的基礎(chǔ)上開展工作,并期望這種努力能夠進(jìn)一步深化我們對(duì)中國(guó)大陸現(xiàn)行政治結(jié)構(gòu)的理解。
二、構(gòu)造博弈論模型
本文將運(yùn)用完全信息動(dòng)態(tài)博弈理論尋求對(duì)精英聯(lián)盟的解釋。為此,需要確定動(dòng)態(tài)博弈的擴(kuò)展式表述,即確定博弈的參與者集合、參與者的行動(dòng)順序、參與者的行動(dòng)集合、參與者的信息集、參與者的報(bào)酬函數(shù)。
參與者集合
這場(chǎng)博弈的參與者包括政府(也可以稱之為“政治精英”或“統(tǒng)治集團(tuán)”)P 、社會(huì)精英(包括經(jīng)濟(jì)精英和知識(shí)精英)E 、社會(huì)大眾M.
把社會(huì)成員劃分為統(tǒng)治集團(tuán)、社會(huì)精英和大眾,其依據(jù)是各個(gè)集團(tuán)與現(xiàn)實(shí)政治秩序的利益關(guān)系及其挑戰(zhàn)現(xiàn)實(shí)政治秩序的動(dòng)機(jī)和能力。而且,這種劃分方法也適合下面將要展開的分析的需要。這正是我從眾多的相互競(jìng)爭(zhēng)的群體分類模式中選擇這種三元(統(tǒng)治集團(tuán)/社會(huì)精英/大眾)分類模式的主要原因。
關(guān)于參與者有兩個(gè)重要假設(shè):第一,參與者都是追求自身利益最大化的理性經(jīng)濟(jì)人。第二,參與者擁有關(guān)于這場(chǎng)博弈的“完全信息”。這意味著,每個(gè)參與者都知道大家都是“理性經(jīng)濟(jì)人”,都會(huì)按照同樣的邏輯思考和選擇,都知道其他參與者的行動(dòng)順序和行動(dòng)集合,都知道每個(gè)參與者過去的選擇情況,也都知道博弈的報(bào)酬函數(shù)。更為重要的是,每個(gè)參與者還知道其他參與者也了解這些信息,而且知道它們也知道它也了解這些信息。
行動(dòng)順序
假定參與者的行動(dòng)順序?yàn),政府首先做出選擇,然后精英做出選擇,最后大眾做出選擇。
無論是改革之初,還是在整個(gè)改革過程中,在力量對(duì)比格局中,政府始終處于絕對(duì)優(yōu)勢(shì)地位,所以,假設(shè)政府最先出牌是合理的。
設(shè)G1為按照“政府→精英→大眾”順序行動(dòng)的博弈模型,G2為按照“政府→大眾→精英”
順序行動(dòng)的博弈模型,而且G1與G2的唯一區(qū)別是參與者的行動(dòng)順序。下面我們僅僅對(duì)G1展開分析。但是,只要對(duì)G2重復(fù)同樣的分析,就可以發(fā)現(xiàn)兩種分析結(jié)果并沒有“實(shí)質(zhì)性差異”。
所以說,在我們的模型中,精英和大眾誰先出牌并不重要。
行動(dòng)集合
為了定義“剝奪”,需要確定一個(gè)基準(zhǔn)狀態(tài),如諾奇克所謂的“最小政府”。這個(gè)“最小政府”也可以理解為亞當(dāng)?斯密的“守夜人”。為維持一個(gè)“最小政府”,社會(huì)必須向政府提供必要的利益。
但是,在“必要利益”之外,政府還有可能追求更多的利益,即“額外利益”。為了追求額外利益,政府需要?jiǎng)儕Z大眾或精英的經(jīng)濟(jì)或政治利益。政府共有4種可行的行動(dòng),即S1={不剝奪精英,不剝奪大眾}、S2={不剝奪精英,剝奪大眾}、S3={剝奪精英,不剝奪大眾}、S4={剝奪精英,剝奪大眾}.現(xiàn)在,不考慮“賄賂”行動(dòng)。
精英和大眾的策略包括“反抗”或“默認(rèn)”,C={反抗},A={默認(rèn)}.
信息集
假設(shè)每個(gè)參與者都知道所有參與者過去的選擇情況。這意味著,在動(dòng)態(tài)博弈的任一階段,在該階段采取行動(dòng)的參與者對(duì)博弈的各個(gè)方面都是“完全知情”的,只有那些將在以后發(fā)生的情況除外。
報(bào)酬函數(shù)
在最小政府狀態(tài)下,設(shè)T 為政府獲得的必要利益,Γe 為精英的收益,Γm 為大眾的收益。
設(shè)Tp為精英或大眾被政府剝奪的政治利益。政府獲得的額外政治利益等于精英和大眾的損失之和。一般來說,在權(quán)威主義政治中,Tp是政府的“當(dāng)然權(quán)利”,所以下面的討論局限于對(duì)經(jīng)濟(jì)利益的剝奪。
設(shè)Te為政府追求的額外經(jīng)濟(jì)利益。
Ce為精英遭到政府剝奪時(shí)進(jìn)行反抗的代價(jià)。Cm為大眾遭到政府剝奪時(shí)進(jìn)行反抗的代價(jià)。
Ces 為精英反抗時(shí)政府付出的代價(jià),Cms 為大眾反抗時(shí)政府付出的代價(jià),Ci為政府采取行動(dòng)Si(i=1、2、3、4)時(shí)精英和大眾共同反抗時(shí)政府付出的代價(jià)。
注意:第一,只有在與“被剝奪的額外利益”進(jìn)行比較時(shí)“反抗的代價(jià)”才有意義。第二,Ce、Cm、Ces 、Cms 是“政府的鎮(zhèn)壓能力”和“被統(tǒng)治者的反抗能力”的函數(shù)。當(dāng)其他條件相同時(shí),政府的鎮(zhèn)壓能力越強(qiáng),被統(tǒng)治者反抗的代價(jià)(Ce、Cm)越大,政府為鎮(zhèn)壓而付出的代價(jià)(Ces 、Cms )越小。同樣,當(dāng)其他條件相同時(shí),被統(tǒng)治者的反抗能力越強(qiáng),其反抗的代價(jià)(Ce、Cm)越小,而政府的鎮(zhèn)壓成本(Ces 、Cms )越高。
假設(shè)精英集團(tuán)與大眾集團(tuán)無法事前達(dá)成可信的私下交易。這個(gè)假設(shè)對(duì)于中國(guó)大陸是完全合理的。這是因?yàn),兩個(gè)集團(tuán)的規(guī)模都太大,根據(jù)奧爾森的集體行動(dòng)理論,很難組織有效的集體行動(dòng),而且,更為重要的是,權(quán)威主義政府幾乎剝奪了公眾組織集體行動(dòng)的一切手段。
首先,考慮政府選擇{不剝奪精英,不剝奪大眾}時(shí)的報(bào)酬函數(shù)。注意,無論是“剝奪”
還是“不剝奪”都僅僅指“額外的經(jīng)濟(jì)利益”,而不包括“額外的政治利益”。再?gòu)?qiáng)調(diào)一次,一般情況下,我們把“額外的政治利益”視為權(quán)威主義政府的“當(dāng)然權(quán)利”。如果精英和大眾同時(shí)反抗,則反抗成功,政府不但得不到“額外利益”,還要付出代價(jià)C1,所以政府的收益為T ?C1.同時(shí),由于精英和大眾都未受到剝奪,但要為反抗付出代價(jià),所以兩者的收益分別為Γe ?Ce和Γm ?Cm.如果精英反抗而大眾默認(rèn),則反抗無效,政府剝奪兩者的政治權(quán)利2Tp ,同時(shí)付出代價(jià)Cse ,收益為T+2Tp ?Cse ;
而精英喪失政治權(quán)利Tp,并付出代價(jià)Ce,收益為Γe ?Ce?Tp;
大眾則僅僅喪失政治權(quán)利Tp,收益為Γm ?Tp.同理,可以得到精英默認(rèn)而大眾反抗的報(bào)酬函數(shù)值。如果精英和大眾都采取默認(rèn),則政府不負(fù)任何代價(jià)剝奪兩者的政治權(quán)利2Tp ,收益為T+2Tp ;
而精英和大眾也僅僅失去自己的政治權(quán)利Tp,收益分別為Γe ?Tp和Γm ?Tp.
政府選擇{不剝奪精英,不剝奪大眾}時(shí)的報(bào)酬函數(shù)
在討論政府選擇S2的報(bào)酬函數(shù)之前,先討論一下精英和大眾各自的“反抗”行為。假設(shè)精英的反抗能力遠(yuǎn)遠(yuǎn)大于大眾,大眾不可能成功地單獨(dú)反抗政府,但只要精英“全力反抗”,即使沒有大眾的配合,政府的剝奪行動(dòng)也將失敗。再假設(shè)精英只有在自己的“額外經(jīng)濟(jì)利益”
受到剝奪的時(shí)候,才會(huì)“全力反抗”,而當(dāng)大眾受到剝奪時(shí),精英的反抗將會(huì)“打折扣”。
中國(guó)大陸的現(xiàn)實(shí)支持這一假設(shè)。由于政府壟斷了暴力和集體行動(dòng)資源,所以除了政治精英以外,其他社會(huì)集團(tuán)都處于“一盤散沙”狀態(tài),社會(huì)精英和大眾只能采取消極反抗,無法組織有效的積極反抗。大眾的消極反抗手段極為有限,非經(jīng)濟(jì)性手段包括上訪、靜坐、罷工、游行、盜竊、殺人、破壞,經(jīng)濟(jì)性手段包括罷工和怠工。但是,政府可以輕易制服大眾的非經(jīng)濟(jì)性手段。大眾危害經(jīng)濟(jì)業(yè)績(jī)的能力也極為有限。他們是無產(chǎn)者或小自耕農(nóng),必須千方百計(jì)出賣自己的勞動(dòng)力以求維持生存。因此,除了好好干活,他們唯一的選擇就是挨餓。但是,精英就不同了。經(jīng)濟(jì)精英可以拒絕參與經(jīng)濟(jì)活動(dòng),如停止投資、向海外轉(zhuǎn)移資產(chǎn)等等。經(jīng)濟(jì)全球化進(jìn)一步強(qiáng)化了他們的權(quán)力。知識(shí)精英特別是其中的專業(yè)人士對(duì)現(xiàn)代經(jīng)濟(jì)運(yùn)行的業(yè)績(jī)具有直接的影響,而且知識(shí)精英可以干預(yù)輿論、鼓動(dòng)學(xué)生鬧事、甚至自己上街鬧事。所以,精英的消極反抗會(huì)對(duì)經(jīng)濟(jì)發(fā)展產(chǎn)生直接的、顯著的負(fù)面影響。如今,官方意識(shí)形態(tài)已經(jīng)失去了提供合法性的作用,政府的合法性嚴(yán)重依賴于經(jīng)濟(jì)增長(zhǎng)業(yè)績(jī)。對(duì)于政府來說,經(jīng)濟(jì)衰退或停滯無異于滅頂之災(zāi)。這意味著,精英的消極反抗可以給政府造成極大的損害。
現(xiàn)在考慮政府選擇{不剝奪精英,剝奪大眾}時(shí)的報(bào)酬函數(shù)。如果精英和大眾同時(shí)反抗,則反抗成功,政府的收益為T ?C2,而精英和大眾的收益分別為Γe ?Ce和Γm ?Cm.如果精英反抗而大眾默認(rèn),由于精英自己沒有受到剝奪,所以不會(huì)“全力反抗”,其結(jié)果是政府只能從大眾那里奪得一部分Te,如λTe,0<λ<1.當(dāng)然,政府會(huì)成功地剝奪精英和大眾的政治利益2Tp ,但要付出代價(jià)Cse ,其收益為T+λTe+2Tp?Cse.相應(yīng)地,精英喪失政治權(quán)力Tp,并付出反抗代價(jià)Ce,收益為Γe ?Ce?Tp.大眾喪失政治權(quán)力Tp和經(jīng)濟(jì)權(quán)利λTe,收益為Γm ?λTe?Tp.如果大眾反抗而精英默認(rèn),則反抗失敗,政府成功地剝奪大眾的Te,同時(shí)還剝奪大眾和精英的2Tp ,但要付出代價(jià)Csm ,其收益為T+Te+2Tp?Csm.而精英僅僅失去Tp,收益為Γe ?Tp.大眾不但失去Tp和Te,還要徒勞地付出反抗的代價(jià)Cm,其收益為Γm ?Cm?
Te?Tp.如果精英和大眾都放棄反抗,則政府同時(shí)剝奪兩者的政治權(quán)利2Tp ,并從大眾那里掠奪經(jīng)濟(jì)利益Te.
政府選擇{不剝奪精英,剝奪大眾}時(shí)的報(bào)酬函數(shù)
下面,考慮政府選擇{剝奪精英,不剝奪大眾}時(shí)的報(bào)酬函數(shù)。S2與S3的區(qū)別在于被剝奪的是精英而不是大眾。如果精英和大眾同時(shí)反抗,則反抗成功,政府、精英、大眾的收益分別為T ?C3、Γe ?Ce、Γm ?Cm.如果精英反抗而大眾默認(rèn),注意此時(shí)精英自己受到剝奪,所以它將“全力反抗”,其結(jié)果是政府的剝奪行動(dòng)失敗。在這種情況下,政府得到2Tp ,但付出代價(jià)Cse ,收益為T+2Tp ?Cse ;
精英保住了Te,失去Tp,付出反抗代價(jià)Ce,收益為Γe ?Ce?Tp;
而大眾僅失去Tp,收益為Γm ?Tp.如果精英默認(rèn)而大眾反抗,則反抗失敗,政府得到2Tp 和Te,但要付出代價(jià)Csm ,收益為T+Te+2Tp?Csm.精英同時(shí)失去Tp和Te,收益為Γe ?Te?Tp.而大眾將失去Tp,并付出代價(jià)Cm,收益為Γm ?Cm?Tp.如果精英和大眾都選擇默認(rèn),則政府的收益與S2相同,但是與S2相比,精英將多失去Te,而大眾則少失去Te.
政府選擇{剝奪精英,不剝奪大眾}時(shí)的報(bào)酬函數(shù)
最后,我們考慮政府選擇{剝奪精英,剝奪大眾}時(shí)的報(bào)酬函數(shù)。假設(shè)政府分別剝奪精英和大眾規(guī)模為Te的經(jīng)濟(jì)利益。按照上述邏輯,我們可以得到這種情況下的報(bào)酬函數(shù)值。
政府選擇{剝奪精英,剝奪大眾}時(shí)的報(bào)酬函數(shù)
在此,討論一下T ?C1、T ?C2、T ?C3、T ?C4的關(guān)系?梢院侠淼丶僭O(shè),在不同的情況下,政府為應(yīng)付反抗而付出的代價(jià)是不同的,(點(diǎn)擊此處閱讀下一頁(yè))
這種代價(jià)應(yīng)該與反抗的強(qiáng)度成正比,而反抗的強(qiáng)度又應(yīng)該與被剝奪的強(qiáng)度成正比。所以有C1T ?C2>T?C3>T?C4.
三、求解模型
我們所構(gòu)造的博弈模型是一個(gè)有限完美信息博弈。Zermelo 和Kuhn證明,一個(gè)有限完美信息博弈有一個(gè)純戰(zhàn)略納什均衡。對(duì)于有限完美信息博弈來說,逆向歸納法是尋找子博弈精煉納什均衡的最簡(jiǎn)便的方法。
在動(dòng)態(tài)博弈過程中,在每一個(gè)決策結(jié)上,參與者在權(quán)衡各種可行行動(dòng)的成本和收益的基礎(chǔ)上做出自己的選擇。具體來說,精英將根據(jù)Ce與Tp、Te、Tp+Te 的關(guān)系進(jìn)行決策,而大眾則根據(jù)Cm與Tp、Tp+λTe、Tp+Te 的關(guān)系進(jìn)行決策。為了尋找子博弈精煉納什均衡,首先,以Ce為橫軸,以Cm為縱軸,做一個(gè)二維笛卡爾坐標(biāo)系。然后,用水平線Cm=Tp 、Cm=Tp+λTe、Cm=Tp+Te和垂直線Ce=Tp 、Ce=Te 、Ce=Tp+Te把第一象限劃分為一些小區(qū)域。最后,運(yùn)用逆向歸納法分別尋找每一個(gè)小區(qū)域內(nèi)的子博弈精煉納什均衡。
全面掠奪型權(quán)威主義國(guó)家
在第一類情況下,子博弈精煉納什均衡為{S4,A ,A},即政府選擇{剝奪精英,剝奪大眾}、精英選擇{默認(rèn)}、大眾選擇{默認(rèn)}.政府剝奪所有人的政治和經(jīng)濟(jì)權(quán)利,而被剝奪者則保持沉默。我把這種情況稱之為“全面掠奪型權(quán)威主義國(guó)家”。
“全面掠奪型權(quán)威主義國(guó)家”出現(xiàn)的條件是:Ce>Tp+Te,或者Cm>Tp+Te并且Tp當(dāng)Ce>Tp+Te時(shí),精英反抗政府剝奪的代價(jià)(Ce)高于因反抗而避免的損失(或默認(rèn)政府剝奪時(shí)所受的損失)(Tp+Te ),因此無論大眾采取什么行動(dòng),精英的最優(yōu)選擇都是放棄反抗。由于精英放棄反抗,加之大眾的單獨(dú)反抗是無效的,因而無論大眾的態(tài)度如何,政府都可以放心大膽地掠奪所有的社會(huì)成員。
當(dāng)Cm>Tp+Te時(shí),大眾反抗政府剝奪的代價(jià)(Cm)高于因反抗而避免的損失(或默認(rèn)政府剝奪時(shí)所受的損失)(Tp+Te ),因此無論精英采取什么行動(dòng),大眾的最優(yōu)選擇都是默認(rèn)。由于精英單獨(dú)反抗最多可以保住Te,但必須付出代價(jià)Ce,又由于Te由此可見,只要與被剝奪的利益相比反抗的成本足夠高,被剝奪者就將默認(rèn)剝奪,而政府就可以肆無忌憚地掠奪。
掠奪大眾型權(quán)威主義國(guó)家
在第二類情況下,子博弈精煉納什均衡為{S2,A ,A},即政府選擇{不剝奪精英,剝奪大眾}、精英選擇{默認(rèn)}、大眾選擇{默認(rèn)}.我把這種情況稱之為“掠奪大眾型權(quán)威主義國(guó)家”。
“掠奪大眾型權(quán)威主義國(guó)家”出現(xiàn)的條件是:TpTp+λTe.
當(dāng)Tp當(dāng)CeTp+λTe,即大眾與精英同時(shí)反抗的代價(jià)(Cm)大于因此而避免的損失(Tp+λTe),所以大眾不會(huì)與精英同時(shí)反抗政府。由于精英單獨(dú)反抗既不能保住Tp,又要付出代價(jià)Ce,所以在這種情況下,精英的最優(yōu)選擇還是默認(rèn)。其結(jié)果是政府可以安全地剝奪大眾。
需要說明的是,在區(qū)域10和區(qū)域11中,{S3,A ,A}也是子博弈精煉納什均衡。當(dāng)存在多個(gè)均衡解時(shí),政府可以在其中任選其一?紤]到政府傾向于保持策略的連續(xù)性,因此可以合理地假設(shè)它將選擇{S2,A ,A}.
最小權(quán)威主義國(guó)家
在第三類情況下,子博弈精煉納什均衡為{S1,A ,A},即政府選擇{不剝奪精英,不剝奪大眾}、精英選擇{默認(rèn)}、大眾選擇{默認(rèn)}.政府滿足于剝奪精英和大眾的政治權(quán)利,而不會(huì)剝奪它們的經(jīng)濟(jì)權(quán)利。我把這種情況稱之為“最小權(quán)威主義國(guó)家”。
“最小權(quán)威主義國(guó)家”出現(xiàn)的條件是:Tp當(dāng)Ce如果政府放棄剝奪大眾的經(jīng)濟(jì)利益,即選擇S1,由于Tp權(quán)威主義崩潰
在第四類情況下,精英和大眾將為保護(hù)自己的政治利益而聯(lián)合反抗政府,而政府又無力鎮(zhèn)壓這種全民反抗,于是權(quán)威主義政治終結(jié)。我把這種情況稱之為“權(quán)威主義崩潰”。
“權(quán)威主義崩潰”出現(xiàn)的條件是:Cm當(dāng)Ce精英勾結(jié)型權(quán)威主義國(guó)家
當(dāng)Ce只要Te>Tp ?Ce,政府就可以從取自大眾的經(jīng)濟(jì)利益(Te)中拿出一部分(Δ)分給精英,使得Te >Δ>Tp ?Ce.此時(shí),新的報(bào)酬函數(shù)為
由于Te >Δ>Tp ?Ce,所以Δ?Tp>?Ce,所以Γe+Δ?Tp >Γe ?Ce.對(duì)于精英來說,這意味著,{受賄并默認(rèn)}要比{反抗}更好。這樣一來,政府通過賄賂精英消弭了精英反抗的動(dòng)機(jī),而精英收受賄賂在之后也就會(huì)默認(rèn)政府對(duì)大眾進(jìn)行掠奪。于是,{{賄賂精英,剝奪大眾},精英受賄并默認(rèn),大眾默認(rèn)}就是一個(gè)新的子博弈精煉納什均衡。其對(duì)應(yīng)的報(bào)酬函數(shù)的值為{T+Te?Δ+2Tp,Γe+Δ?Tp,Γm ?Te?Tp }.
歷史現(xiàn)實(shí)可以幫助我們理解精英勾結(jié)型權(quán)威主義國(guó)家出現(xiàn)的機(jī)制。隨著市場(chǎng)和經(jīng)濟(jì)的發(fā)展,精英的勢(shì)力日益膨脹。當(dāng)精英的實(shí)力足夠大時(shí),一方面,他們具有較強(qiáng)的反抗政府的能力,或者說,反抗政府的代價(jià)較小,即Ce較小,另一方面,他們對(duì)政治權(quán)利的要求較強(qiáng),即Tp較大,于是就會(huì)出現(xiàn)Ce在此前的3篇文章中,我已經(jīng)描述了統(tǒng)治集團(tuán)“賄賂”社會(huì)精英的具體形式。例如,通過不斷推進(jìn)市場(chǎng)化改革,實(shí)施鼓勵(lì)經(jīng)濟(jì)發(fā)展的政策,禁止獨(dú)立工會(huì),壓制輿論,降低環(huán)境標(biāo)準(zhǔn),政府為經(jīng)濟(jì)精英創(chuàng)造了最有利的賺錢環(huán)境。通過錢權(quán)勾結(jié)和裙帶關(guān)系,政治腐敗還為經(jīng)濟(jì)精英創(chuàng)造了可觀的非法獲利渠道,如侵吞國(guó)有資產(chǎn)、偷稅漏稅、走私、騙匯、生產(chǎn)和銷售假冒偽劣產(chǎn)品等等。此外,通過吸收入黨,安排進(jìn)入政府、人大和政協(xié),資本家和經(jīng)理們的“面子”(政治地位的象征)也得到相當(dāng)程度的滿足。再如,通過提供適當(dāng)?shù)难哉摽臻g,進(jìn)入官僚系統(tǒng)和經(jīng)商的機(jī)會(huì),大幅度提高工資,高標(biāo)準(zhǔn)的就業(yè)、醫(yī)療、退休保障,政府也滿足了知識(shí)精英的利益訴求。需要指出的是,這些賄賂形式并非都是統(tǒng)治者處心積慮的設(shè)計(jì),有的屬于無意為之,有的甚至是無可奈何的妥協(xié)或權(quán)宜之計(jì)。
其他可能情況
如果政府垮臺(tái)會(huì)導(dǎo)致社會(huì)失去秩序,陷入全面混亂,其結(jié)果是全社會(huì)都遭殃,而不僅僅是政府遭殃。對(duì)應(yīng)的報(bào)酬函數(shù)的值為{T ?C ∞,Γe ?C ∞,Γm ?C ∞}.C ∞表示一種無法承受的代價(jià)。而且所有參與者都明確地了解這一點(diǎn),即形成為一種社會(huì)共識(shí)。那么,不但是政府,而且精英和大眾都將極力避免共同反抗局面的出現(xiàn),結(jié)果是共同反抗不會(huì)出現(xiàn)。我把這種情況稱之為“政府綁架社會(huì)”。在這種情形下,政府就可以為所欲為。因此,聰明的政府總是極力制造自己是秩序的唯一提供者的“共享信念”。
如果精英和大眾都已經(jīng)高度組織化,就存在雙方達(dá)成事前協(xié)議的可能性。在這種情況下,被剝奪的一方可以要求另一方和它一起聯(lián)合抵制政府,事成之后,它將給后者支付補(bǔ)償。在這種情況下,政府將放棄剝奪行為,轉(zhuǎn)型成為“最小權(quán)威主義國(guó)家”。
如果Ce如果精英和大眾的實(shí)力旗鼓相當(dāng),則政府或是同時(shí)剝奪兩者;
或是任選其一進(jìn)行剝奪,而不剝奪另一個(gè);
或是任選其一進(jìn)行剝奪,同時(shí)賄賂另一個(gè);
或是放棄任何剝奪企圖。根據(jù)North 、Weingast和青木昌彥,在這種情況下,也許會(huì)出現(xiàn)“民主型國(guó)家”或“社會(huì)契約的民主型國(guó)家”。
如果大眾的實(shí)力超過精英,則大眾將取代上述分析中精英的位置。如果CmTp?Cm,則政府將剝奪精英,并向大眾行賄。這意味著,建立社會(huì)保障制度或俾斯麥型的福利國(guó)家。
我們可以進(jìn)一步放寬研究的視野。例如,“精英”可以進(jìn)一步劃分為“經(jīng)濟(jì)精英”和“知識(shí)精英”。這樣一來,參與者集合擴(kuò)大了。但是,只要模型仍然是有限完美信息動(dòng)態(tài)博弈,就可以運(yùn)用同樣的方法求解,只不過求解的過程稍微復(fù)雜一點(diǎn)而已。
只要重新定義參與者、行動(dòng)策略和報(bào)酬函數(shù),模型可以適用于計(jì)劃時(shí)期的中國(guó)大陸。例如,可以用“城市”(或“工業(yè)部門”、“市民集團(tuán)”)代替“精英”,用“農(nóng)村”(或“農(nóng)業(yè)部門”、“農(nóng)民集團(tuán)”)代替“大眾”等等。根據(jù)同樣的邏輯,我們可以發(fā)現(xiàn),政府將傾向于采取{不剝奪城市,剝奪農(nóng)村}或{賄賂城市,剝奪農(nóng)村}策略。同樣,經(jīng)過適當(dāng)調(diào)整,我們的模型也可以分析建國(guó)前后的“土地改革”和“社會(huì)主義改造”運(yùn)動(dòng)。在這種情況下,“精英”可以是“地主”、“資產(chǎn)階級(jí)”或“知識(shí)分子”。根據(jù)同樣的邏輯,我們可以發(fā)現(xiàn),在計(jì)劃體制下或?yàn)榱私⒂?jì)劃體制,政府必然傾向于選擇{剝奪精英,不剝奪大眾}或{剝奪精英,賄賂大眾}策略。
四、博弈論模型傳達(dá)的信息
本文所作的一切,不是為了把已有的思想“翻譯”為數(shù)學(xué)語(yǔ)言,即僅僅用博弈論術(shù)語(yǔ)重新表述過去的思想。實(shí)際上,這種分析能夠?yàn)槲覀兲峁┰S多重要的“新知識(shí)”。它不但可以幫助我們加深對(duì)現(xiàn)行政治結(jié)構(gòu)的理解,也可以加深我們對(duì)政治演變歷史的理解。
改革之初,在計(jì)劃體制下,政府實(shí)施的是{賄賂城市,剝奪農(nóng)村}策略。從計(jì)劃到市場(chǎng)的經(jīng)濟(jì)轉(zhuǎn)型徹底改變了博弈的外生規(guī)則。參與者變了,報(bào)酬函數(shù)也變了。在20世紀(jì)80年代,相對(duì)于毛時(shí)代,政府采取了{(lán)不剝奪精英,不剝奪大眾}策略。這一策略的另一種標(biāo)準(zhǔn)表述形式為“放權(quán)讓利”,即政府同時(shí)降低了對(duì)精英和大眾的剝奪程度。但是,由于市場(chǎng)化改革帶來了巨大的增長(zhǎng)效應(yīng),這一時(shí)期,政府的收益并沒有因?yàn)椤胺艡?quán)讓利”而減少。這是一個(gè)“三贏時(shí)代”,即政府、精英、大眾的收益同時(shí)提高。由于受到“八九風(fēng)波”的刺激,90年代初期,政府轉(zhuǎn)而實(shí)行“全面剝奪”策略。但是,這一策略很快就被它的制定者主動(dòng)放棄了。在全球化時(shí)代,對(duì)于一個(gè)嚴(yán)重依賴經(jīng)濟(jì)增長(zhǎng)為自己提供合法性的政府來說,剝奪精英無異于自取滅亡。于是,90年代中期以后,聰明的政府轉(zhuǎn)而采取{賄賂精英,剝奪大眾}策略,即統(tǒng)治集團(tuán)與社會(huì)精英勾結(jié)起來掠奪大眾。這樣一來,中國(guó)大陸就演變?yōu)椤熬⒐唇Y(jié)型權(quán)威主義國(guó)家”。在此前的3篇文章中,我把這一時(shí)期的群體關(guān)系稱為“精英聯(lián)盟”,并用“贏家通吃”概括它的利益分配效應(yīng)。
那么,關(guān)于“精英聯(lián)盟”博弈論還告訴了我們什么新的東西?博弈論主張,思考制度的最合理的思路是將它概括為一種博弈均衡。此前的分析表明,以市場(chǎng)和權(quán)威主義政治作為外生變量,那么精英聯(lián)盟——精英勾結(jié)型權(quán)威主義國(guó)家——就是一種內(nèi)生博弈規(guī)則。根據(jù)博弈論所揭示的納什均衡的基本性質(zhì),我們可以指出和解釋精英聯(lián)盟的一系列重要屬性。
首先,精英聯(lián)盟是穩(wěn)定的。在博弈論看來,作為納什均衡的精英聯(lián)盟實(shí)質(zhì)上就是一種特殊的策略組合,它使得每個(gè)參與者的策略是對(duì)其他參與者策略的最優(yōu)反應(yīng)。而且精英聯(lián)盟是一種帕雷托最優(yōu)狀態(tài),即任何參與者都不可能在不損害其他參與者利益的條件下改善自己的利益。這也意味著,社會(huì)一旦進(jìn)入這種狀態(tài)就很難從中擺脫出來,或者說精英聯(lián)盟具有很高的穩(wěn)定性。
其次,精英聯(lián)盟是自我實(shí)施和自我維系的。納什均衡是所有參與者關(guān)于博弈將會(huì)如何進(jìn)行的“一致”預(yù)測(cè)。也就是說,納什均衡能夠使參與者預(yù)測(cè)到它,而且能預(yù)測(cè)到他們的對(duì)手也能預(yù)測(cè)到它。既然所有參與者能夠預(yù)測(cè)到這一均衡(精英聯(lián)盟)會(huì)出現(xiàn),而且這一均衡又屬于帕雷托最優(yōu),那就沒有任何參與者有動(dòng)力采用與該均衡不同的行動(dòng)。在這種意義上,精英聯(lián)盟就是“自我實(shí)施的”。同時(shí),精英聯(lián)盟也是自我維系的。參與者基于共有信念而做出的決策共同決定了均衡的再生,均衡的再生反過來又強(qiáng)化了共有信念。這樣一來,制度成為自我維系的。其實(shí),制度作為一種均衡現(xiàn)象,只要?jiǎng)e人不忽略它,任何人都不敢違抗它的權(quán)威,從而對(duì)人們的策略選擇構(gòu)成影響。
最后,建立精英聯(lián)盟需要時(shí)間。博弈規(guī)則的有效性依賴于參與者是否共享某種關(guān)于博弈將如何進(jìn)行的“知識(shí)”或“信念”。那么,參與者的完全信息和共享信念來自哪里?答案是,來自經(jīng)驗(yàn),來自學(xué)習(xí),來自實(shí)踐中的學(xué)習(xí)過程。在我們的分析中,參與者被假定為是完全理性的,而且擁有完全信息,可以預(yù)測(cè)自己和其他參與者的所有選擇及相應(yīng)的結(jié)果。這是古典博弈理論的基本假設(shè)。但是,實(shí)際上,現(xiàn)實(shí)中的博弈參與者卻并非如此。他們僅僅擁有有限的信息和理性,并根據(jù)自己以往的經(jīng)驗(yàn)進(jìn)行歸納推理。針對(duì)這種情況,進(jìn)化博弈論假設(shè),在每一個(gè)特定的時(shí)期,參與者的信息是有限的,而且他會(huì)根據(jù)以往的經(jīng)驗(yàn)做出當(dāng)前的決策,以實(shí)現(xiàn)眼前利益的最大化。正是通過從經(jīng)驗(yàn)中學(xué)習(xí),參與者才有可能積累起越來越豐富的經(jīng)驗(yàn),發(fā)展出越來越有效的分析能力,進(jìn)而逐漸逼近“完全信息”和“完全理性”狀態(tài)。其實(shí),古典理性觀點(diǎn)的均衡概念大致上可以理解為是學(xué)習(xí)的產(chǎn)物。(點(diǎn)擊此處閱讀下一頁(yè))
相關(guān)熱詞搜索:中國(guó)大陸 博弈 內(nèi)生 規(guī)則 解釋
熱點(diǎn)文章閱讀