選單

真實的人們如何博弈

博弈是一種生活經驗。一個生活經驗豐富的人,即便不懂博弈論,也可以是博弈高手。反過來,如果一味推崇博弈理論,卻忽略真實世界人們豐富的行為動機,就極可能犯下錯誤。經典的博弈論,假設個人只關心自己,追逐物質利益,會趨利避害,偏好穩定而行事極其理性。這都不是真實世界的故事。最近三四十年,越來越多的研究確認瞭如下幾個重要的違反經典博弈論假設的事實,這些事實值得我們在現實博弈時謹記在心。

第一,人並不完全是自私自利的。

毫無疑問,人必須為自己爭取利益,才能在生存競爭中為自己贏得更大優勢。但是,成員都自私自利的群體,比之成員都不那麼自私自利的群體,競爭力會弱得多。生物進化是在“個體-群體”兩個層面進行的,個體層面的競爭要求個體充分自利,群體層面的競爭要求個體不那麼自利。所以,群居的個體要形成社會,社會透過規範、文化等顯在的或隱性的獎懲體系來懲惡揚善,排斥極端自私的個體。漫長的人類進化過程,是社會和個人的共同進化過程。個人行為塑造社會,但社會也為個人行為立下法則;共情、互愛、忠誠、守規、犧牲等等都寫入了人類的基因。結果,在社會中生存的個人,不僅關注自己的利益,也會適當關心社會中他人的利益。人們通常願意在一定程度和範圍內犧牲個人利益去遵守道德規範或社會規則,即使這個程度和範圍對於某些人來說非常小;極度自私和絕對私利導向的人,是很罕見的。

第二,人並非只關注物質利益。

人們的行為既受市場制度約束,也受非市場制度約束;既受正式制度約束,也受非正式制度(規範和社會文化等)約束。人們追求豐裕的物質利益,但也追求高尚的道德情操。在不同的環境或制度約束下,人們會考慮其行為的適宜性。比如,在情感領域,人們通常難以接受市場手段,正如金錢可以買到婚姻,但買不到愛情。婚前財產公證,本來有利於避免離婚財產爭議,但現實中人們卻很少進行此類公證,因為它常常被視為對婚姻沒有信心的訊號而不被接受。有研究表明,幼兒園為了防止家長遲到,而對遲到的家長罰款,反而導致更多家長遲到——因為沒有罰款前,遲到的家長本來還心懷內疚,並儘量注意下不為例,而罰款之後,家長對遲到心安理得,因為他已花錢“購買”了遲到的權利。也有研究表明,採取經濟激勵,可能會降低志願者的努力程度,因為志願者並不願意被人看作是“為了錢”。

第三,人並不總是能冷靜而理性。

我們的大腦,有兩套決策系統:“快思考”系統依賴直覺,反應快速但容易失誤;“慢思考”系統基於深思熟慮,反映較慢但不易犯錯。經驗對於決策至關重要。結果是,真實的人在諸多重要決策上可能並非依靠理性分析,而是依靠直覺來做出的。諸如吃飯穿衣之類的日常生活瑣事,天天會遭遇,時時可練習,日積月累的經驗可把此類問題的決策技巧磨礪到最優;而一些人生大事,比如結婚生子,一生也經歷不了幾次,難有經驗可循,所謂的深思熟慮到頭來也不過是“大致”、“差不多”就行。可見,人們對重大問題的決策自以為更加慎重(他們確實也更慎重思考過),卻未必比在日常瑣碎問題的決策上更加理性,質量也未必更高。

第四,人們的偏好是情景依存的。

主流經濟學觀點假設,人們的偏好是穩定且獨立於情景的。換言之,若我認為物A比物 B更好,那麼我在任何狀態下都會認為A比B好。這是很不靠譜的假設。讀者不妨想想是否也有這樣的經歷:我決定上街去吃晚飯,在家時想著上街去吃粵菜而不是川菜,走到街頭突然改變主意去吃川菜而不是粵菜。主流經濟學會認為這種偏好逆轉違背了偏好一致性公理,但我自己明白,在家和在街頭情景不同了,我對川菜和粵菜的選擇矛盾實際上不過是情景變化的結果而已。如果“偏好獨立於情景”這一主流經濟學觀點真是對的,那麼,若一個女孩會答應一個男孩的求婚,她應該無論在什麼場合都會答應的,既然如此,那些堅持主流經濟學這一假設的經濟學家們,他們何必還要精心籌劃一個浪漫的情景來求婚呢?

為什麼要記住這些違背經典假設的事實?因為,理論畢竟不是現實,當理論運用於現實的時候,需要新增現實的“細節”才可能獲得成功。正如亞里士多德在《形而上學》開篇即表達過的觀點:經驗使人成功,技術是讓人明白為什麼成功。懂得博弈理論,還需要充分考慮人類行為的各種現實“細節”,才可以在策略互動中做得更好。

譬如,既然人們的動機並非只看重經濟利益,也看重道德情操,那我們就可以透過喚醒道德動機來改善人們的行為。道義勸告和教育的力量有時非常巨大的,甚至可能優於經濟激勵。依靠公開宣告某個行為是反社會的,這一禁令可以與個體的價值觀互補,保證人們在道德上不表現出反社會的行為,而不是象在傳統激勵的一些情形下擠出道德情感。

行為經濟學家Dan Ariely等人做過一項實驗。他們到加州大學洛杉磯分校招了一些學生,讓他們做一個簡單數學測試。測試一共有20道題,每道題都給出一組數字,讓他們從中找出相加等於10的兩個數。測試時間是5分鐘,答得越多越好,然後讓他們抽籤。中籤的可按照本人的成績,每答對一道題就有10美元的獎勵。實驗要求一組同學將答卷直接交給實驗主持人,這是控制組。另外一組則把答卷粉碎掉,只需報告實驗主持人他答對了多少道題,很明顯,這一組被試有作弊的機會。毫不奇怪,他們確實作弊了。實驗的關鍵一招是,在實驗開始之前,實驗者要求一部分受試寫出他們高中時讀過的10本書名,其餘的則要求寫出《聖經》十誡的內容,記得多少寫多少。做完實驗的這一“回憶”環節,才讓受試開始做數學題。實驗結果表明,沒有作弊機會的條件下,被試平均答對了3。1道題。在有作弊機會的條件下,回憶高中時代10本書的參與者平均(報告)答對了4。1道題。最重要的是,寫下《聖經》十誡的學生,雖然有機會作弊,但是他們根本就沒有作弊!他們的成績與那些沒有作弊機會的一組完全相同。

是《聖經》的教義影響了學生的誠實行為嗎?事實上,很多學生記不清楚十誡有哪些。只能寫出一兩條和能寫出十條的學生都表現出了誠實,這意味著鼓勵人們誠實的並非十誡的條文字身,而是出於某種道德準則的深思。如果真是這樣,我們就可以用道德準則來提高大眾的誠實水平。

有興趣的讀者可以上網查查寧波鄞州高階中學圖書館的相關新聞報道,這個圖書館無人看護,卻並無多少圖書遺失,已被當作人們自發誠信行為的一個典型案例。我曾讓朋友去這個圖書館拍下不少照片,發現這個圖書館雖然沒有攝像頭,也沒有報警器,但卻處處在喚醒人們的道德動機。圖書館入口處懸掛著“道之以法,齊之以禮,有恥且格”、牆上貼著不是其他圖書館常見的大大的“靜”字,而是“圖書館無門,我把誠信門”、“顯示讀書軌跡,考量道德底線”、“尊重規則是對自我的尊重”……這個無人圖書館治理的成功,充分顯示了道德準則確實有巨大的力量。

又譬如,既然人們的行為產生於快思考和慢思考兩套決策系統,而符合經濟邏輯的是慢思考系統,這意味著對人們的機會行為的治理也需區別其來源。刻意算計後的機會主義行為,運用經濟手段加以治理是容易見效的;而僅僅處於無意識的機會主義行為,可能對經濟治理機制反應就不會太敏感。譬如無意識說謊和欺騙,常常產生於理性算計之外的因素,對其治理有時用經濟刺激之外的手段可能更見效。

一個有趣的例子是男廁所清潔的治理。我們很少見到動用經濟手段(比如罰款)來強制上廁所的男人小便時不要飛濺到便池外,因為很難罰款監督。其實,也有一些出於“快思考”系統的治理手段。比如荷蘭阿姆斯特丹的男士洗手間,每個小便池裡都印著一隻蒼蠅的圖案,在排水口附近偏左一點地方。設計者的意圖在於刺激男士只對準一個方向“射擊”,從而避免尿液四處橫流。僅僅這樣一個不起眼的設計,便勝過用經濟刺激解決問題。原因在於,人們小便時射擊方向常常是無意識的,經濟邏輯並不適用。

對於司機超速我們如何控制?經濟學家的答案是超速罰款,這也是現實中做法。但諾貝爾經濟學獎得主Thaler在他和Sunstein的《Nudge》一書中提到一個有趣的例子:芝加哥市區的湖畔路由直行轉入彎道,需要大家減速行駛,他們用的辦法是,在到達彎道之前的路面上畫上很多橫向的平行線,剛開始平行線的間距相等,接近彎道時,間距變得越來越小,這樣給看著路面的司機造成在加速的錯覺,司機會不自覺地去踩剎車,車速就降下來了。這也是利用了“快思考”系統。

快思考和慢思考對於政策和制度設計是深有意蘊和啟示的。不假思索的行為(快思考),不太權衡經濟成本和收益,因而對經濟激勵可能不太敏感,採用經濟激勵之外的手段反而可以更有效地解決問題。對於深思熟慮的行為,它們常常是經濟成本和收益權衡之後的結果,經濟激勵在對付這樣的行為時,常常會效果顯著。

再譬如,既然人們的偏好是情景依存的,人們會判斷在特定場合特定的行為是適宜的抑或不適宜的,那麼,對人們的機會主義行為的治理,還可以考慮從情景設計入手。一個常被提及的例子是,犯罪行為往往依賴於犯罪情景。對於預防犯罪,經濟學提出的經典解決思路是增加街頭的警力以及加大對違法者的懲罰。但是我們會發現,街頭犯罪並不是處處常見,而是在某些區域比較集中。很明顯,犯罪高發區域看上去就是犯罪高發區域的樣子。不可否認,犯罪行為有理性的成份,甚至許多犯罪就是經過理性計算的,但是犯罪現場的情景也常常是影響犯罪行為的重要因素。斯坦福大學心理學教授Philip Zimbardo在1969年的實驗提供了例證:兩輛相同的汽車,將其中一輛停在加州帕洛阿爾託的中產階級社群,而另一輛停在相對雜亂的紐約布朗克斯區。他把停在布朗克斯的那輛車的車牌摘掉,頂棚開啟,結果當天就被偷走了。而放在帕洛阿爾託的那一輛,一個星期也無人理睬。然後,Zimbardo用錘子把那輛車的玻璃敲了個大洞。結果僅僅幾個小時之後,它就不見了。我們完全有理由相信:房屋的修葺一新、街道的整潔,甚至警示的標語,都會對犯罪行為產生重要影響,因為對於潛在罪犯來說,在不同的情境中,他會得出適宜或不適宜從事犯罪行為的不同結論。文學作品中也出現過情景變化遏制犯罪動機的例子,不信可看看諷刺小說家O。 Henry(1862-1910)廣泛流傳的短篇小說《警察與讚美詩》。

有利於喚醒道德動機的情景,將更有利於治理機會主義行為。而“情景”是可以塑造的。回到經濟治理這樣一個重要問題上來,人們的行為和態度會相互影響,形成反饋,最終會形成有利於或不利於遏制機會主義興起的情景。比如,在一個組織中,如果派系林立,組織成員之間的信任就會淡薄,每個人都時刻提防著其他人的行為,這種提防行為加劇了組織成員之間的不信任,最終組織中機會主義行為大行其道。俗話說“風氣不正”,這是一個糟糕的“情景”。相反,一個組織中成員之間更多是友好相處、坦誠相見,這種態度和行為會產生正反饋,組織中就更能基於集體利益採取行動,也更能避免集體行動的困境。人們一直認為,文化建設對於組織管理是重要的,其實本質上正是因為良好的組織文化可以作為一種“情景”影響其成員的偏好。

與情景依存偏好可以有緊密聯絡的,還包括最近三十年興起的“社群治理”(community governance)概念。在治理機制的頻譜上,一端是市場,另一端是政府,位於中間的便是社群。社群透過區域性資訊和同行壓力來促進人們採取恰當的行為。特別是在出現社會互動性質或產品和勞務合約難以完備時,社群經常可以解決一些市場和政府束手無策的問題。其中的原因,一方面是高效的社群可以監督其成員的行為,使其對自己行為負責;另一方面,是社群可以獲取到政府、僱主、銀行及其他正式組織難以獲取的分散的私人資訊。除此之外,還有一個重要的方面,就是社群的文化、規範,是影響人們行為的最重要的因素之一:社群文化、規範等等塑造了特定的“情景”,讓人們明白哪些行為在這個社群是適宜的和不適宜的。良好的社群文化和規範,將極大地遏制人們的機會主義行為。

最後,我想對讀者說的是,博弈理論是理解矛盾衝突的工具,但是這個工具運用於現實的時候,還需要對人性有更深層的把握。絕對不能把對於人性的理解,停留在經典理論所持有的假設上面。理論的假設,是對人性的關鍵部分的濃縮概括,抽象掉了很多具體的“細節”資訊。當理論運用於現實的時候,我們需要恢復對“細節”資訊的考慮,才能更好地理解人類社會中的矛盾和衝突。

(原載《經濟學家茶座》第81輯)