實驗經濟學方法論(王道一) 第一章 導論 一、實驗經濟學簡介 (一)何謂實驗經濟學? 你有沒有想過「科學(Science)」是什麼?「科學」在字典的解釋是「用來描述普遍真理或普遍法則如何運行的系統性知識,特別是透過科學方法獲得與檢驗的知識。1」這個定義很有趣,居然用「科學方法」來定義「科學」。那麼,何謂「科學方法」?如果「科學方法」就是「科學的方法」,那豈不是套套邏輯式(tautological)循環定義?還是說,科學方法就是「科學家所用的方法」,那麼怎麼界定誰是科學家呢?顯然,除非我們可以清楚定義「科學方法」2,不然「何謂科學」就成了一個無解的大哉問。 英文維基百科(Wikipedia)對於「科學方法」的定義則是「科學方法希望用可重複驗證(reproducible)的方式來解釋自然現象,並據以作出有用的預測。達成方式有觀察自然發生的現象,以及(或)用實驗在控制條件下產生自然發生的現象。」3用這種方式定義的科學方法,能夠幫助我們釐清科學的定義。從這個定義來看,任何一門科學所使用的科學方法,目的是可以重複驗證、作預測;達成的方式則包含「觀察自然發生的現象」與「利用實驗在控制條件下產生自然發生的現象」。所以,如果經濟學確實是一門科學,即使只是「社會」科學,她也應該可以重複驗證作預測,研究的方式則包含被動的觀察與主動的實驗。 關於作預測的部分,也許有些人會認為,社會科學只能解釋現象,不能作預測。尤有甚者,有的社會科學的學者甚至會只以「解釋過去」作為目標,而完全不考慮「預測未來」。但是,如果經濟學只能解釋現有的現象,卻不能預測任何新現象,那表示經濟學所使用的研究方法,還不太符合科學方法的定義,因為科學方法要求要能重複驗證,並且據以作出有用的預測。 芝加哥學派掌門人富利曼(Milton Friedman)教授在面對別人批評「經濟學的假設不正確」的時候,他的回應是:只要人類行為表現出來「彷彿(as if)」那些 1 entry 3a defines science as knowledge or a system of knowledge covering general truths or the operation of general laws especially as obtained and tested through scientific method. 2 defines scientific method as principles and procedures for the systematic pursuit of knowledge involving the recognition and formulation of a problem, the collection of data through observation and experiment, and the formulation and testing of hypotheses. 「科學方法(scientific method)」是「一些有系統地追求知識的原則和程序,包括發現和提出問題、透過觀察和實驗收集資料,提出並驗證假說。」 3 states that A scientific method seeks to explain the events of nature in a reproducible way, and to use these reproductions to make useful predictions. It is done through observation of natural phenomena, and/or through experimentation that tries to simulate natural events under controlled conditions. It provides an objective process to find solutions to problems in a number of scientific and technological fields. 1
實驗經濟學方法論(王道一) 假設是正確的即可。也就是說,經濟理論的好壞,是根據預測能力來決定的。4由此觀之,經濟學的目的絕不只是解釋過去、放馬後砲而已,還要能夠對未來做某種程度的預測。雖然,一般都認為經濟學家的預測還不太準確,5但是,至少經濟理論應該是以預測現象為目標。 至於經濟學檢驗理論的方式,一般我們看到的都是科學方法定義中所討論的第一種方式,也就是「觀察自然發生的現象」。所謂的「經濟實證」,不論是勞動經濟中的公共政策分析,產業經濟對特定產業分析,還是總體經濟對於經濟成長模型的實證分析,在在都是透過各種統計資料來「觀察自然發生的現象」。這跟天文物理很像,因為通常天文物理的理論預測都無法在實驗室裡面觀察到,只能透過望遠鏡觀察遙遠的星系來驗證理論。6 可是,科學方法裡面還有另一種檢驗理論的方式,就是「利用實驗在控制條件下產生自然發生的現象」。如果我們可以在控制的環境下,去產生自然發生的經濟現象,那就是經濟學的實驗。這種實驗對檢驗理論很有用,因為在實驗中我們可以考慮「在其他條件不變下,改變某個變數對結果的影響」,進而檢驗因果關係是否成立。所以,「實驗經濟學」就是用科學方法的「實驗方法」來做經濟學的研究。因此,嚴格說起來實驗經濟學並不是一個特定的研究領域,而是像經濟理論、經濟實證一樣,是一種研究經濟學的方法。 也許你會覺得,經濟學怎麼可能有實驗來產生真實世界的經濟現象呢?其實,經濟學的實驗並沒有你想像中那麼罕見,因為每一個新政策的推行,都是一個「政策實驗(policy experiment)」。只要所推行的政策是「人工控制」,而不是自然發生的,就算是一種「控制條件」,所產生的效果就是一個實驗。舉例來說,許多南美洲國家,以及國共內戰時期的國民政府、現在的辛巴威面對惡性通貨膨脹,都算是在做貨幣政策方面的政策實驗。7台灣政府2009年1月18日推出的「消費券」,也算是一個政策實驗。不過,一般的政策實驗由於只有「實驗組」,沒有「對照組」,導致這些政策的成效不易衡量。 要衡量一個政策的成效,必須要有合適的「對照組」來跟「實驗組」比較。要產生合適的「實驗組─對照組」組合,最有效的辦法是透過隨機選取。 學畢業、受教於富利曼等人的智利本土經濟學家來主導智利的經濟政策。許多人將智利接下來經濟成長優於南美洲其他國家,歸功於這些自由經濟的政策,富利曼甚至公開讚揚此一「智利奇蹟(miracle of Chile)」。可是,到底這個「政策實驗」是否成功,仍有不少爭論,因為沒有一致公認的對照組來做比較。詳見: 2
實驗經濟學方法論(王道一) 像經濟發展方面的研究,就有許多是政策的「隨機現地實驗(randomized field experiment)」。舉例來說,麻省理工學院經濟系的達芙珞(Esther Duflo)教授和哈佛大學甘迺迪學院的克萊默(Michael Kremer)教授等人就經常在非洲或印度等發展中國家,利用小規模的政策試辦過程,透過隨機選取不同人參與「實驗組」與「對照組」,來評估一個新政策(比如說教育政策)到底有沒有效果。8這種政策實驗,就算是一種「經濟學實驗」。在這些隨機現地實驗中,政策的決定是在實驗者(試辦者)的控制條件下隨機決定的。既然「實驗組」與「對照組」是隨機決定的,看到兩組結果的不同,我們就能做出因果關係的推論。 不過,值得注意的是,有一些反事實的推論是沒有辦法用實驗來做的。舉例來說,2004年台灣總統大選前一天發生了一件出乎所有人意料的事情。如果我們要問:若此事件沒有發生,選舉結果會不會改變?又,會如何改變?我們並沒有辦法用實驗的方式來回答這個問題,因為我們無法在控制的條件下,重現類似2004年3月19日發生正副總統被槍撃前的情況,也無法回到過去,讓兩顆子彈事件不發生,所以我們無法用實驗做這種反事實的推論。 另外,除了政策方面的「現地實驗」之外,一般實驗經濟學講的實驗,指的是在實驗室裡進行的「控制實驗(controlled experiment)」,也稱為「實驗室實驗(lab experiment)」。9在(電腦)實驗室裡進行的實驗,通常是邀請學生來做受試者(subjects),在電腦上給他們一些不同的經濟情境,要求他們做出經濟決策。和一般的問卷調查不同的是,這些決策通常都有真實的後果,不論是直接影響受試者參加實驗所領取的金錢報酬,或是受試者會根據他的決定得到不同的物品作報酬。10舉例來說,最常見的是實驗中會依據不同的決定贏得數目不等的「實驗貨幣(Experimental Currency Unit, ECU)」,而這些實驗貨幣最後會透過一個固定的匯率換算為新台幣,連同參加實驗的「定額車馬費(show-up fee)」一起當場付現。 也許你會問,為什麼這種看似遊戲般的玩意兒會被當成是認真的實驗呢?主要是因為經濟理論認為人們會對誘因作出反應(People response to incentives),而且這個誘因可以是金錢、物質、甚至是精神上的誘因。因此,當一個決策情境有真實的誘因存在時,即使看起來像是玩票,經濟理論應該都可以對人們所做的決定作出可受檢驗的預測。所以,只要受試者的決定都有「真實的後果」,這些「實驗室實驗」裡,受試者所做的決定都可以拿來檢驗經濟理論的預測是否正確。 8 Kremer (2003), Randomized Evaluations of Educational Programs in Developing Countries: Some Lessons," American Economic Review Papers and Proceedings, 93(2), 102-106. 9由於實驗經濟學的實驗大多數是實驗室實驗,有時候我們也就乾脆把實驗室實驗稱為「實驗」,其他特別的才叫「現地實驗」、「政策實驗」等等。 10 舉例來說,有的實驗要求受試者必須在電腦上選擇不同的圖形。為了確保這個決定有真實的後果,實驗者就在實驗的最後隨機地選取一個回合,把受試者在該回合所選取的圖形印成T恤送給受試者當紀念品。另外,許多「消費者選擇商品」的實驗,實驗者都會當場準備真實的商品讓受試者必須真的買下來帶回家。這些都是為了確保受試者的決定都有真實的後果。 3
實驗經濟學方法論(王道一) 反過來說,如果我們認為經濟理論不能預測人們在實驗室裡的行為,其實是告訴我們,經濟理論並不是那麼放諸四海皆準,至少在實驗室裡面,不論是誘因不夠大,或是基於其他理由,經濟理論並不適用。但是,即使如此,能發現理論模型的適用範圍,還是相當有用,因為可以讓我們知道理論預測何時會準、何時不準。11 (二)實驗經濟學的兩大傳統 瑞典銀行紀念諾貝爾經濟科學獎在2002年頒發給開創實驗經濟學的兩位學者,臥龍‧史密斯(Vernon Smith)和丹尼‧卡尼曼(Daniel Kahneman)。其中史密斯是經濟學家,但是卡尼曼其實是心理學家。這兩位學者代表的是實驗經濟學的兩個不同的「傳統」。這兩大傳統的來源雖然不同,但是後來互相影響,也一起攜手成長。 史密斯是第一位有系統進行經濟學實驗的學者,從六十年代就開始在普渡大學(Purdue University)做了許多「市場實驗(market experiments)」,研究亞當斯密所謂「看不見的手」(市場機能)究竟如何運作,也成功地說服大家經濟學不只能被動觀察自然發生的經濟現象,也能夠主動透過實驗來檢驗經濟理論。他搬到亞利桑那大學(University of Arizona) 之後,開始開發軟體、在電腦上進行實驗,也發展實驗經濟學的基本方法論,奠立經濟學實驗的理論基礎。有趣的是,由於他認為實驗經濟學才是真正的(實驗)科學,因此當他創立實驗經濟學學會的時候,他把它取名叫「經濟科學學會(Economic Science Association)」,特別用單數來表示實驗經濟學是唯一的經濟科學。每年實驗經濟學學會的北美地區年會也固定在亞利桑那州的土桑市(Tucson)舉行。 卡尼曼則與另一位心理學家阿摩司‧特維斯基(Amos Tversky)一起研究「行為經濟學」12,把心理學對於人們如何決策、如何犯錯的想法寫成數理模型,引入原本的經濟理論,使之更貼近人類的行為。13舉例來說,他們兩人曾在經濟學最頂尖的期刊Econometrica發表「展望理論:分析風險下的決策(Prospect Theory: an Analysis of Decision Under Risk)」14,據信是該期刊有史以來被引用次數第二高的文章。15該文修正期望效用理論,引入心理學上「損失趨避(loss aversion)」與「杞人憂天的程度(non-linear probability weighting)」的概念,寫出新的數理模型,來解釋人們的風險決策不符合期望效用理論之處。 11 物理學上類似的例子是牛頓力學的適用範圍:古典的牛頓力學在尺度極小的時候不適用(必須改用量子力學),在物體移動速度接近光速的時候也不適用(必須改用相對論)。 12 「行為經濟學」這個名詞不太恰當,因為如果只有某種經濟學能夠解釋人類行為,被稱為「行為經濟學」,那豈不是表示其他的經濟學都是「非行為經濟學」、不能解釋人類行為嗎? 13 特維斯基擅長建構心理學的數理模型,這在心理學家中相當罕見。一般猜測如果不是特維斯基過世得太早,2002年他應該會跟卡尼曼一起獲獎,因為卡尼曼許多的數理模型都是跟他共同發表的,而他過世後,卡尼曼也就不再發表數理模型了。 14 Kahneman and Tversky (1979), Prospect Theory: An Analysis of Decision under Risk, Econometrica, 47(2), 263-292. 15 引用排名第一的應該是White (1980), A Heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity, Econometrica, 48(4), 817-838. 4
實驗經濟學方法論(王道一) 為了要檢驗這些新的理論模型,是否比原有的經濟模型更能預測人們的經濟行為,實驗經濟學也開始進行大量個別決策(individual decision making)與賽局的實驗來比較不同理論預測人類經濟行為的能力。再加上卡尼曼與特維斯基所引入的觀念,許多都來自心理學實驗,因此心理學的實驗結果和實驗方法都對實驗經濟學有許多啟發。 這兩個傳統出發點不同,一個是從研究市場制度出發,由上而下研究不同的制度與交易規則如何影響一個市場的效率性,以及市場收集個別資訊、引領買賣雙方達到均衡的能力。另一個傳統則是從個體決策出發,由下而上研究如何引入心理學觀念來建構有限理性(boundedly rational)的數理模型,看看能不能比原本標準的模型更準確地預測人類的經濟行為。但是制度的成敗,必然跟參與在其中的人對制度(誘因)的反應有關,而了解人們的有限理性,則是設計更好、更可行制度的基礎。因此,這兩個傳統相輔相成,互相影響,就好像個體理論中有賽局論和全面均衡理論相輔相成一樣。 一直到現在,實驗經濟學的兩大研究主題「市場設計(market design)」和「行為賽局論(behavioral game theory)」就分別承繼這兩大傳統而來。「市場設計」所問的問題是:給定我們已經知道大量市場實驗的結果,面對不同的產業,我們能否設計一個新的交易制度來達到我們的目的(譬如說增進效率)?而「行為賽局論」則跳脫了一般賽局論純數學的框架,嘗試預測真人在不同遊戲規則下如何做決定,可能會犯哪些錯誤等等。接下來的兩節中,我們要透過幾個著名的實驗來介紹這兩大主題。 二、市場實驗與市場設計 (一)發現看不見的手(Seeing the Invisible Hand) 史密斯的得獎之作,研究的是雙邊喊價市場(double oral auction)的實驗。其實在史密斯之前,愛德華‧張伯倫(Edward Chamberlin)就已經在哈佛大學經濟學研究所的課堂上進行市場交易的實驗。張伯倫的市場實驗一般被稱為交易坑市場(pit market),指的是金融市場交易的地方(通常是一個交易員聚集在一起的角落)。他發給每位學生一張卡片,指定他成為買家或賣家,卡片上面的數字決定他的(買方)願付價格或(賣方)成本。然後,張伯倫讓所有的買家賣家在教室內自由談判,達成協議的人就來跟他申報交易,他則把交易價格公佈在黑板上。由於所有買方的卡片代表需求曲線,所有賣方的卡片代表供給曲線,這個實驗的交易價格和數量,就可以拿來檢驗部份均衡理論是否正確。實驗結果顯示,不同的買賣雙方交易價格差很多,市場交易的數量也多半比均衡理論所預測的均衡數量來得多。因此,張伯倫認為簡單的供給需求理論根本不能解釋人們真實的交易行為,因為市場上沒有人知道供給曲線、需求曲線究竟長什麼樣 5
實驗經濟學方法論(王道一) 子。這個結果雖然在1948年就發表在經濟學頂尖的期刊Journal of Political Economy,但是卻沒有人重視。16 史密斯當學生的時候雖然沒有修過張伯倫的課程,卻參與過張伯倫的實驗,因此他後來開始做研究時決定嘗試類似的研究。他認為張伯倫作實驗的想法是對的,但如果要否定均衡理論預測市場交易結果的能力,顯然應該用一些「比較好」的交易制度,而非故意選擇一個比較差的交易方式,例如要大家自己去談判。17於是他就選擇用當時已經運用在股市的雙邊喊價規則,讓買賣雙方公開喊價,一邊喊「x元買進」,另一邊則喊「y元賣出」,願意接受的人則喊「接受」,由實驗者充當交易員撮合交易。 實驗的結果讓史密斯大吃一驚:在雙邊喊價市場中,交易價格(和數量)很快就調整到供需理論所預測的均衡價格(和數量),顯示部分均衡理論有強大的解釋力,只是先前張伯倫沒有使用最好的交易規則。18這個實驗最特別的是,雖然買賣雙方沒有人事先知道供給需求為何,但是市場卻能透過雙邊喊價制度、透過集中市場的交易員這隻「看得見的手」,把買賣雙方的資訊收集起來,使最後的交易價格和數量達到供需理論所預測的均衡價格、數量,彷彿大家事先就知道所有資訊一樣。這正是海耶克(Friedrich A. Hayek) 認為市場經濟比計畫經濟在資訊的運用上更有效率之處。19後續的研究,包括嘗試不同的交易規則,不同的市場型態、交易標的等等,甚至可以研究股市泡沫的產生與破滅。 (二)課堂實驗一:部分均衡理論的市場實驗 要了解市場實驗,最簡單的辦法是找機會直接參與類似的實驗。課堂實驗一「發現看不見的手」就是張伯倫的交易坑市場實驗與史密斯的雙邊喊價市場實驗的簡化版本。實驗說明如下:(詳見附錄) 我們將選出四十位同學參與交易實驗,其中二十位同學為買方,剩下二十位為賣方。每位同學會拿到一張有數字的撲克牌。(J代表11,Q代表12,K代表13,但A代表1) 拿到紅色(方塊、紅心)的是賣方,拿到黑色(黑桃、梅花)的是買方。請收好這張牌確保別人無法看到牌上的花色數字。每張牌代表你們可以買賣的某商品一單位。 賣方:每一位賣家每回合可以賣出一單位的某商品。牌面數字乘以十代表的是您賣出一單位所需要付出的生產成本,因此您賣出一單位的利潤就是您所賣出的價格減去牌面上的數字乘以十。如果您沒有達成交易,您該回合的利潤 16 Chamberlin, E. (1948), An Experimental Imperfect Market, Journal of Political Economy, 56, 95 108. 17 Smith, V. L. (1991c), Experimental Economics at Purdue, in V. L. Smith (ed.) Papers in Experimental Economics, Cambridge University Press, Cambridge, 154 158. 18 Smith, V. L. (1962), An Experimental Study of Competitive Market Behavior Journal of Political Economy, 70, 111 137. 19 Hayek (1945), The Use of Knowledge in Society, American Economic Review, 35(4), 519-30. 6
實驗經濟學方法論(王道一) 就是零,但也不必負擔任何成本。舉例來說,如果您拿到的卡片是紅心二,而您賣出某商品的價格是三十元,那您的利潤就是十元。 買方:每一位買家每回合可以買進一單位的某商品。牌面數字乘以十代表的是您如果買到了該物品,您會獲得的價值,因此您的利潤就是牌面上的數字減去您所買進的價格。如果您沒有達成交易,您該回合的利潤就是零。舉例來說,如果您拿到的卡片是黑桃九,而您買進某商品的價格是四十元,那您的利潤就是五十元。 交易規則: (A) 自由談判:所有的買家賣家有五分鐘的時間自由個別談判,如果兩個人達成協議,就請到前面來向實驗者申報交易並繳回撲克牌。談判時不能強迫,申報之後亦不能反悔。實驗者會在黑板上寫下並宣告交易價格。 (B) 看得見的手:實驗者充當交易員,聽取買賣雙方舉手喊價:「X元買進」或「Y元賣出」,並紀錄在黑板上。如果有買家或賣家願意接受另一方的喊價,則喊「成交」。成交後,雙方到前面來向實驗者申報繳交撲克牌。每次成交後再重新開始下一單位的喊價。 利潤記錄與結算:每回合後,請在記錄表上填入報酬(賣方則填入成本)和成交價格,並計算本回合的利潤。最後的總利潤除以十五則是您所獲得的分數。您的分數越高,成績越高。 2008年的實驗經濟學課堂實驗有三十位同學參與,價格通通除以十之後的結果如下: 回合 成交價格 交易數量 自由談判1 5, 6, 5, 3, 8, 8, 8 7 自由談判2 6, 4, 8, 4, 6, 7, 7, 7, 5 9 看得見的手1 6, 10, 7, 7, 7, 8, 8, 7 8 看得見的手2 7, 6, 6, 6, 6, 7, 7, 7 8 由前兩回合可以看到上面的例子中,交易坑巿場這個交易規則有多糟,這也是張伯倫在哈佛大學課堂上的結論。在交易坑巿場「自由談判」下,成交價格在第一回合從3元到8元差異很大,第二回合稍微改善,但變異仍大(比不上後來採用雙邊喊價市場「看得見的手」)。成交量則在經過一回合的學習後,第二回合以後的成交量增加並且固定在8-9單位。 另外,交易坑巿場交易到最後,所有還沒有賣出或買進的人,會自動聚集在教室的某一個區域,自動形成一個地域性的巿場。主要是因為集中在某個實際的「交易區域」可以增加交易成功的機會。就好像在古早農業社會中,每 7
實驗經濟學方法論(王道一) 個小小的鄉村總會有一個巿集或巿場,讓所有住在附近的人都能在固定市集進行交易。由此可知,市集的地點其實是由地域、區位等交易規則以外的條件決定的。譬如說,2008年的大一經濟學原理在大教室上課,第一回合形成兩個交易市集,但是一大一小,到第二回合,小的交易市集就併到大的去了。 第三、四回合採用雙邊喊價市場「看得見的手」,成交價格很快就集中在7元附近,彷彿大家都看出,這個巿場理論上的均衡價格約在6到7元之間,大部分買進或賣出的同學都沒有「賺到」,但也沒有「虧到」,不像在交易坑巿場,容易發生有人少賺、有人多賺的情形。 而且,從雙邊喊價市場的結果,我們發現:每個交易的買家賣家並不需要知道所有牌面數字的分配情形,經由巿場「看得見的手」調配供需的結果,所有該買的都會買到,而所有該賣的都可以賣出去。 在實驗中買賣雙方的供給需求曲線如下圖所示: Seeing the Invisible Hand12 10 Price 8 6 Demand Supply 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 Quantity 理論上的均衡價格與均衡數量均為7。與實驗結果相較,成交價格的確朝均衡價格移動,到最後一回合看起來像是收斂到均衡價格了。但是在成交量方面,除了第一回合是7單位之外,都超過均衡數量,甚至在第二回合交易坑巿場,成交量高達為9單位。 也許你會覺得很奇怪,為什麼會有買方願付價格比賣方成本低的買賣雙方願意交易?其實,這是因為一開始時的成交價格有高(8元)有低(4元),價格波動使得原先願付價格太低的買方(在4元時)與成本太高的賣方(在8元時)都有機會成交。既然這種「不應該」成交的人有可能交易了,交易坑巿場上,「均一價格法則(Law of one price)」不一定會成立。而從社會的總剩餘來看,願付價格太低的買方與成本太高的賣方如果交易,其實是沒有效率的,那些人參與交易,只會把餅做小,因為社會生產該單位的成本大於消費該單位的願付價格。值得注意的是,在第二回合交易坑市場,後面幾次交易價格已經開始收斂,在雙邊喊價市場中,價格幾乎全部都收斂了(第三回合出現的10元成交,喊到的 8
實驗經濟學方法論(王道一) 同學馬上就承認那是不小心的錯誤,可是不能反悔了)。扣除錯誤的情況,成交量剛好是7。第四回合中的成交量為8,也是因為有願付價格低(6元)的買方,在價格等於6元的時候成交所造成的。 由上面的實驗結果可以看出來,不同的交易規則所產生的巿場力量其實是不同的,而最簡單的供需理論對於成交價格的預測其實是相當準確,但還是有一些無法用簡單的供需理論解釋的有趣現象。例如:價格的波動、大家如何「發現」均衡價格等等。 當然,交易坑市場和雙邊喊價市場只是所有可能的交易規則中的兩種。而規定每個買方都只要買一單位的商品、賣方都只要賣一單位的商品,這也是簡化的限制。如果你要為紐約証券交易所設計交易機制,你可以考慮各式各樣不同的交易規則,和買賣雙方的偏好。在上述的實驗,每個人都只能買一樣東西,然而在股票巿場中,每個人可以買二、三張,甚至是一百張股票。還有,如果在股市下錯單,那該如何取消?巿場設計的重點,就是要在各式各樣的遊戲規則中,找出到底哪一個規則是最好的(或是比較好的),以促進交易的效率。舉例來講,目前的紐約証券交易所,一直努力在加速其每秒鐘可處理的下單數,以避免像是1987年10月19日黑色星期一,全球股市大崩盤時,紐約證交所交易電腦不堪負荷當機的不幸事件重演。20 (三)市場實驗的應用:市場設計 從大量的市場實驗中,實驗經濟學累積了許多寶貴的經驗,可以在人們要設計一個新的市場,或新的交易規則時提供參考。舉例來說,從上述的市場實驗中,我們很清楚地看到市場收集資訊的能力。因此,有學者用市場收集資訊的能力設計出「預測市場」,透過買賣不同事件的期貨(亦即某事件發生就會得到1元),來預測即將發生的事情,像是選舉結果、運動賽事的結果、電影票房、央行貨幣政策等等。愛荷華州立大學的愛荷華電子市場(Iowa Electronic Market) 就是最著名的政治期貨市場,連台灣兩千年總統大選的三位候選人都有期貨喔!21 既然實驗可以幫助我們設計一般市場,它也可以幫助我們設計或改良一些比較特別的市場,像是配對市場(matching market)。舉例來說,哈佛大學經濟系的阿文‧駱(Alvin E. Roth)教授就曾經重新設計美國醫學生統一分發畢業實習醫院的配對市場(National Residence Matching Program),其中一個有意思的改良在於處理夫妻或男女朋友共同分發的問題。22一般來說,夫妻或男女朋友通常會希望雙方可以在同一個醫院或同一個地區實習,以免分隔兩地之苦。而醫院也希望自己員工的眷屬就近工作,免得一方因為思念另一方而降低工作效率或 20 Aaron Lucchetti, After Crash, NYSE Got the Message(s): Exchange Raised Buy-Sell Capacity; Thain’s Goal: 64,000 Per Second, Wall Street Journal, October 16, 2007. 21 22 Roth and Peranson (1999), The Redesign of the Matching Market for American Physicians: Some Engineering Aspects of Economic Design, American Economic Review, 89(4), 748-780. 9
實驗經濟學方法論(王道一) 提高離職率,而使醫院的成本增加。 但原本的統一分發制度要求兩人分別填志願、一起繳交,然後註明哪一個人要先分發。分發系統會先分發這個人,等到確定第一個人分發到哪裡之後,再分發他/她的另一半。問題是,這樣的分發方式要求兩人必須決定「以誰為主」分發,另一方只能犧牲配合,不見得有效率。因此,新的制度就決定允許讓夫妻雙方(或男女朋友)共同填一張志願表,以兩個人為單位填寫志願,系統再一次分發二個人。 類似這樣的市場設計,不見得要限制在有金錢交易的市場喔!舉例來說,雖然器官買賣是違法的,美國卻設計了一個活體器官捐贈的「腎臟交換機制(kidney exchange)」來增加捐贈配對成功的機會。一般而言,病患的家屬通常會願意捐贈器官給病患,但是血型等生理上的配對不見得跟病患相符。像丈夫捐器官給妻子,在醫學上排斥的風險比陌生人捐贈要大 (因為妻子在懷孕的過程中會接觸到與丈夫相關的組織,因而在免疫的排斥上會造成影響) 。在這種情況下,如果有兩對夫妻,妻子都是病患,丈夫都願意捐贈器官,但是都有排斥的問題,那其實可以考慮允許他們「交換」,就是讓丈夫們互相捐給對方的妻子,這樣就兩全其美了。類似的多方連環交換也是可行的,只要有自願捐贈者到器官交換巿場登記,將其器官捐獻給需要的人,然後再由該病患的親人捐出自己的器官給下一個需要的人,如此循環不已。這樣的「交換機制」在沒有金錢交易的情況下,依然能夠透過撮合自願性的「交換(swap)」或者是「連環交換(chain)」來增加整體的效率。23 三、行為賽局論(Behavioral Game Theory) 要討論「行為賽局論」,得先從「賽局論(game theory)」說起。賽局論研究的是個體在爾虞我詐的環境中互動的結果。這裡的個體通常是人類,但也可以是基因、公司或國家等具有行為能力的個體。24不同的「賽局(game)」,就是需要籌思對策的各種不同情境。在一個賽局中,幾個重要的元素包括參與的玩家(Players)、她們可以選擇哪些策略(Strategies),以及不同策略組合(strategy profile)下每個玩家的報酬(Payoffs)。 賽局論原本只是一個數學工具,但是應用在經濟學研究卻有幾個重要的發展。馮紐曼(Von Neumann)和摩根史坦恩(Morgenstern)首開先河,把賽局論引入經濟學。25但是,奈許均衡(Nash Equilibrium)卻是大家最常用的觀念。有趣的是,奈許均衡被廣泛接受,甚至許多學者都直接使用奈許均衡而不註明出處、 23 Rhonda L. Dundle, A Daisy Chain of Kidney Donations, Wall Street Journal, September 23, 2008. 24互動的環境會「爾虞我詐(strategic)」,是因為在經濟學討論的賽局通常是「非合作賽局(non-cooperative games)」,而非「合作賽局(cooperative games)」。 25 von Neumann and Morgenstern (1944), Theory of Games and Economic Behavior, Princeton University Press. 10
實驗經濟學方法論(王道一) 不引用奈許原來的論文。以致許多人並不知道,奈許原來的文章其實不是發表在經濟學期刊,而是在自然科學僅次於Science與Nature的頂級期刊Proceedings of the National Academy of Sciences (PNAS)。26 後來,為了考慮資訊不透明(asymmetric information)的情形,哈尚義(John C. Harsanyi)發明了貝氏賽局(Bayesian game),允許每個人可能有不同的類型(Types),但是自己是哪一型只有自己知道。如此一來,資訊不透明的情況可以看作是每個人都有自己的類型來代表他所知道的資訊,而奈許均衡在貝氏賽局中的推廣,就是貝氏均衡(Bayesian Nash equilibrium)。27身為「應用」數學,賽局論能廣泛地應用在不同的領域,也能做出精確的預測,因為透過數學,賽局論可以很精確算出在某個特定情境下,不同對手各自做決定的結果會如何。因此,我們稱這種賽局論為「數學賽局論(analytical game theory)」,是用數學來分析不同聰明程度的玩家、在不同的賽局中,可能會採取何種對策。 數學賽局論必須用到許多數學工具,因此進入門檻比較高,這是一個學習上可能的問題。但這只是門檻高而已!更大的問題是:數學賽局論其實是理論經濟學家用一枝筆、一張紙算出來的結果。因此,數學賽局論的預測,多半來自理論經濟學家自我的想像與猜測,而非人們實際上怎麼做。這麼一來,數學賽局論的結果就不見得符合真實世界的情況。更有甚者,大家對數學賽局論沒有資料驗證習以為常,也就不會去蒐集足夠的證據來驗證數學賽局論的預測。 然而,馮紐曼和摩根史坦恩在賽局論的開山巨著「賽局論與經濟行為(Theory of Games and Economic Behavior)」中就有提到,「跟物理學相比,經濟學在數理化時,所知的相關經濟事實真的太少了!在物理學上,要是沒有泰谷的天文觀測紀錄,刻卜勒和牛頓不可能寫出行星運動定律。同樣地,如果沒有足夠資料,經濟學如何有同樣發展?」28因此,要把理論建立在足夠的觀察資料上面,這是經濟學本來就應該面對的挑戰。 可惜的是,即使到今天,馮紐曼和摩根史坦恩當時所面對的問題依然存在。由於觀察資料取得不易,所以數學賽局論現在還是主要用數學來討論,卻沒有考慮用資料來檢驗其預測結果是否合乎現實。29問題是當我們不願意用資 26Nash (1950), Equilibrium Points in n-Person Games , Proceedings of the National Academy of Sciences of the United States of America, 36(1), 48-49. 27 哈尚義的論文太長,分成三篇發表:Harsanyi (1967), Games with Incomplete Information Played by Bayesian Players, I-III. Part I. The Basic Model , Management Science, 14(3), 159-182. Harsanyi (1968), Games with Incomplete Information Played by Bayesian Players, I-III. Part II. Bayesian Equilibrium Points , Management Science, 14(5), 320-334. Harsanyi (1968), Games with Incomplete Information Played by Bayesian Players, I-III. Part III. The Basic Probability Distribution of the Game , Management Science, 14(7), 486-502. 28 Our knowledge of the relevant facts of economics is incomparably smaller than that commanded in physics at the time when mathematization of that subject was achieved It would have been absurd in physics to expect Kepler and Newton without Tycho Brahe---and there is no reason to hope for an easier development in economics. Von Neumann and Morgenstern (1944), The Theory of Games and Economic Behavior. 29也許有人會問,為什麼近年來經濟理論跟空中樓閣一樣,並沒有從實際觀察出發呢?馮紐曼 11
實驗經濟學方法論(王道一) 料來檢驗理論模型的時候,我們也同時限制了理論的實用性,因為一個不能被否證(falsify)的理論既然沒有可供實證的內涵(empirical content),其實就只是一種信仰,在科學上沒有實際的用處。 數學賽局論有什麼用處?賽局論本來應該和所有其他經濟理論一樣,可以用來預測人們的行為。如果賽局論的假設正確的話,它不但能夠預測人們最終的行為,也能夠解釋人們的行為,闡明他們為什麼要這樣做。最後,如果賽局論可以預測人類行為,也能夠解釋人們行為背後的「道理」,那賽局論也應該可以為在不同情境下的人們提供建言,建議人們應該怎麼作才能達到他們的目的。因此,賽局論應該可以「預測」,提供「解釋」,並且「建議」人們應該怎麼做。 舉例來說,拍賣理論在數學賽局論上有幾十年的發展,最近十幾年開始應用在實際的拍賣制度設計,像是美國聯邦通訊委員會(FCC)的頻道拍賣。可是,這些實際的拍賣設計並不是單純套用拍賣理論的結果,而是理論、實驗資料與實際拍賣的結果三方面互動的產物。在實驗經濟學上,許多實驗室實驗都試著驗證拍賣理論的預測,有部分的預測符合實驗結果。因此,拍賣制度的設計者會根據拍賣理論和這些實驗結果仔細設計符合特定產業的拍賣制度,然後先用實驗室實驗來驗證新的設計是否符合預期,最後才是拿到實際的拍賣市場來應用。最近,侯瑞(Jacob K. Goeree)和侯特(Charles A. Holt)在為美國聯邦通訊委員會設計2008年700Mhz的頻道拍賣的時候,就是先用實驗測試原有的拍賣制度,發現原先的設計太複雜,甚至會循環不止、無法決標,因此就設計了一個比較簡單、甚至可以不用電腦進行的拍賣制度,先在實驗室裡確定拍賣結果符合預期,然後才建議聯邦通訊委員會採納、實際應用在頻道拍賣上。30 如果數學賽局論只是單純用紙筆推導,不願意考慮實證資料是否符合理論預測,那就可能是空中樓閣、跟現實無關。相反地,行為賽局論(behavioral game theory)的目的是要探討人們實際上怎麼做決定。這個決定可以是在自然發生的情境下做決定,也可以是在人為產生的情境下做決定。因此,「行為賽局論」會收集人類經濟決策的資料(通常是人為控制的實驗資料,但是如果有自然發生的資料當然更好),再試著用數學寫出新的理論模型來解釋我們觀察到的現 和摩根史坦恩不是已經大聲疾呼觀察資料的重要嗎?行為賽局論大師卡默勒教授提供了一個可能的解釋:當奈許在1950年代發表了奈許均衡的論文之後,他應該有試著和蘭德智庫的學者合作研究囚犯兩難之類的賽局實驗以驗證奈許均衡。不過,他們做出來的結果與奈許均衡不同──雖然奈許均衡預測兩邊都會背叛對方,但是他們的實驗中卻總有一些人不願背叛對方。由於沒有辦法解釋這些實驗結果,於是他們就認定實驗也許不是驗證理論的好辦法。因此,後來的賽局論就多半是最聰明的數學家坐在書桌前算出來的結果,與真實的人類行為不見得有相關。要一直到七十年代末和八十年代初,才重新開始有人採用實驗的方法來研究賽局論。從事後的角度來看,目前已經有一些新理論可以用來解釋奈許等人當初所看到的現象,只是當時他們並沒有想到。舉例來說,當人們不只對自己的獲利有偏好,也關心他人的獲利的時候,這種富有「同情心」的社會偏好就會讓這些人在囚犯的兩難中選擇合作、而非背叛。 30 Goeree and Holt (2007), Hierarchical Package Bidding: A Paper & Pencil Combinatorial Auction , Games and Economic Behavior, forthcoming. 12
實驗經濟學方法論(王道一) 象。行為賽局論根據上百個實驗的實驗結果,修正了數學賽局論原本的模型,考慮人們可能有「社會偏好(social preferences)」,人們只有「有限理性(boundedly rational)」,以及反覆面對類似情境時人們會學習。加入這些元素,目的是要讓理論模型更準確地預測人們的行為。 下面用三個實際例子來說明行為賽局論的發展。首先,「最後通牒談判(Ultimatum Game)」的實驗結果激發經濟學家提出「不公趨避(inequality aversion)」的社會偏好理論。「選美結果預測(p-beauty contest, aka guessing game)」的實驗結果帶出「多層次思考(level-k thinking)」的有限理性模型,而學習理論(learning theory)則在「產業發展分水嶺(continental divide)」的實驗中預測了多重均衡下的均衡選擇。 (一)最後通牒談判 (Ultimatum Game)實驗 加州理工學院社會科學院的卡默勒(Colin F. Camerer)曾經講過他跟同事去旅遊時遇到的故事。他們一行人在觀光勝地遇見了一位攝影師主動幫他們照相,之後把洗好的照片拿給他們看,希望他們以一張美金五元的價錢購買。卡默勒和他同事們對那位攝影師說:「這些照片你留著也沒用,不然我們用一塊錢跟你買好了」,但是那位攝影師卻死都不肯降價。此就是最後通牒談判的例子。 在最後通牒談判實驗中,一方為下通牒的提議者(proposer),另一方則為回應者(respondent)。下通牒的一方先提出他的方案(proposal),建議桌上的錢(例如10元)要如何分配,而回應的一方則只能選擇接受或不接受這個方案。如果回應者選擇接受,就按照提議的方案分配,如果不接受,則兩方報酬均為0。 傳統的數學賽局論告訴我們,由於回應的一方只在乎自己所分到的錢,而不在乎提議者拿到多少錢,而有一元比沒有好,所以他會接受任何分配,即使他分到的錢很少也沒關係。故完全均衡(subgame perfect equilibrium)為:提議的一方會提議給對方0元(或是1元、1角等最小的貨幣單位),自己則拿走全部,而回應的一方會接受。 但是在真實世界中,人們往往會有一種公平的概念。因此,如果對方給自己的錢太少,他們會選擇拒絕,寧可自己不拿一塊錢,也要給對方一個教訓,讓對方蒙受極大的損失。因此,如果分配的總金額很大(比方說一億),那賽局論預測回應者會接受一元對九千九百九十九萬九千九百九十九元這麼不公平的方案,這樣的均衡結果顯然就很不符合實際的現象。 我們在許多不同實驗中觀察到的結果,大部分提議的分配比例都接近五十五十對分,低於六十四十的「不公平」方案,隨著不公平的程度上昇,被拒絕的比例就越高,而八十二十以下極端不公平的方案則幾乎通通被拒絕。行為賽局論解釋這種現象的辦法,一般是在效用函數中加入某種對公平的偏好,比如說「不公趨避(inequality aversion)」,這樣就能夠產生「你對我不仁,我就對 13
實驗經濟學方法論(王道一) 你不義」的偏好,進而解釋實驗中看到的現象。31因此,看到實驗結果不符合數學賽局論的預測,不代表人們不理性,只是回應的一方並非單純追求自己物質上的報酬最大,還會追求社會公平。 這個實驗有許多後續的研究,接下來講到「社會偏好」時會專門介紹。不過,有兩個最近的研究值得一提。第一個實驗是有一群人類學家到世界各地的不同原始部落去做這個實驗,發現有些部落的實驗結果很不一樣。這些不同的結果,反映出不同文化下對「公平」看法不同。但有趣的是,市場化程度越高的地方,五十五十對分的情形越多,表示對不公平的厭惡程度愈大。因此,市場經濟不見得就會帶來自私自利,反而可能培養大家互信互利的社會共識(social norm)。32 如果要進一步去解釋人們對公平的偏好從何而來,實驗經濟學有一個分支叫做「神經經濟學(neuroeconomics)」,可以用一些儀器,像是功能性核磁共振造影(functional Magnetic Resonance Imaging, fMRI),在受試者作實驗時掃描他們的大腦,看看到底是哪些腦部區域在運作。因此,有一些研究會發現,在面對不公平分配的時候,跟情緒有關的腦部區域反應較強烈。這表示人們「覺得不公平」,以致決定拒絕此一分配,確實是受到情緒的影響。當然,這只是相關性,不見得有因果關係。但是,就有人根據這個結果,進一步用穿顱磁力刺激(Transcranial Magnetic Stimulation, TMS)暫時打亂取捨情緒和理智思考的腦部區域(Dorsolateral Prefrontal Cortex, DLPFC),在這樣的影響下,人們會傾向接受不公平的分配。這表示理性思考和情緒衝動之間的衝突,的確是我們報復不公平對待的主因。33 (二)選美結果預測實驗(p-Beauty Contest Game or Guessing Game) 凱因斯(John M. Keynes)在他的名著「通論」中認為,股票市場就像是預測選美大賽的結果:「這不是要挑每個人各自認為最漂亮的[臉蛋],更不是要挑大家公認最漂亮的。我們已經想到第三層去,努力預測一般人心目中認為大家公認最漂亮的會是誰。而且,我相信有些人還可以想到第四層、第五層或更高。()」這段話反映出股票市場「消息面」上自我實現的預言:當所有人都認為某支股票會漲的時候,它便會上漲。因此,大家都在努力預測何時「所有人都認為某支股票會漲」,用以預測股價上漲。於是,更聰明的人就應該要 預測到底什麼時候「所有人都認為所有人都認為某支股票會漲」,用以預測何時大家會做出上漲預測,以搶得投資先機。這種多層次的思考(level-k thinking),就是行為賽局論探討的重要主題之一。 31 這必須要改變描述偏好的效用函數中。詳見第三章對「社會偏好」的討論。 32 Henrich, Boyd, Bowles, Camerer, Fehr, Gintis and McElreath (2001), In search of Homo economicus: Behavioral experiments in 15 small-scale societies , American Economic Review, 91(2), 73-78. 33 Knoch, Pascual-Leone, Meyer, Treyer and Fehr (2006), Diminishing Reciprocal Fairness by Disrupting thr Right Prefrontal Cortex, Science 314, 3 November 2006, 912-915. 14
實驗經濟學方法論(王道一) 選美結果預測(p-beauty contest, aka guessing game)就是上述多層次思考的例子。考慮以下的實驗:班上每位同學都從0到100選一個數字,然後算出所有人數字的總平均,最接近總平均乘上三分之二的人獲勝,贏得獎金。請問你會怎麼選?傳統賽局的均衡告訴我們,如果不斷地推理、刪除不可能獲勝的策略,最後的奈許均衡解應為大家都選0。 但是所有的實驗結果,沒有一群受試者在一開始就都選0的。尤有甚者,加州大學聖地牙哥分校(UCSD)的克萊佛(Vincent P. Crawford)教授到世界各地的經濟系演講相關研究時,他也當場問在場的經濟學家他們會選多少,只有芝加哥大學經濟系的教授們異口同聲地說0,因為那些教授都知道大家都跟自己一樣聰明,會解出均衡策略是0。然而在其他所有的學校,即使自己解出均衡是0,很多人還是不會選0,因為認為也許有人不知道0是均衡解。34 2008年實驗經濟學課堂實驗,大家所選數字的分佈結果為下圖: p-Beauty Contest Results1086420102030405060708090100Guess 所有人選的數字,其平均為,因此平均的三分之二是。這和一般實驗室實驗中看到的結果相似。然而,從數字的分佈頻率可以看出有三個人寫的數字很奇怪,居然選超過八十。檢查原始的實驗資料,有一個人選100,另一個人是95,最後一個人寫的是86。這些人顯然是在惡搞,因為即使所有人都選100,平均的三分之二也不可能超過67。他們選的數字既然遠超過67,當然絕不可能獲勝。 34 要不斷地刪除不可能獲勝的策略,必須假設大家都跟我一樣聰明。如果有人沒有我聰明,那選0並不是最好的策略,因為平均的三分之二會被那些不選0的人拉高。反而是能夠準確預測「一般人會選多少」的人比較容易獲勝。芝加哥學派的經濟學家相信理性預期,認為大家都跟自己一樣聰明,因此就都會選0。 15 Frequency
實驗經濟學方法論(王道一) 也許你會覺得很奇怪,為什麼有人會這樣選呢?一個可能的原因是誘因不足,因為該次課堂實驗並沒有真的付錢(也未列入成績計算),以致有些人存著看好戲的心態來選數字。但是即使將此三人的答案排除,平均仍然高達,而平均的三分之二變成,仍然遠大於0。因此,即使存心惡搞的人確實會有一些影響,但是實驗的主要結論仍然成立──人們並沒有一開始就都選0。 在正式的實驗室實驗中,第一回合很多人都會選介於21到40之間的數字。35為什麼一開始的時候不是所有的人都猜0呢?這可能是因為人群中有些人比較天真(或是沒有想太多),第一回合不會馬上選0 。因此,即使你知道均衡解是0,你也不會選0。36而且,理論上並不需要真的有人那麼天真,只要「有人認為有人比較天真」,就會造成這個結果。 然而,如果第二回合、第三回合繼續重複做同樣的實驗,平均的三分之二會漸漸變小。到第十回合的時候,大概所有人都會選0了。這表示經過一番學習之後,大家原本對別人的認知不一致的情形漸漸消失,玩到最後大家都會猜0,因為均衡就是所有人對所有人的認知都一致、有共識(common knowledge)的狀況。 針對第一回合的實驗結果,行為賽局論發展出「多層次思考(level-k thinking)」的理論來解釋這些認知不一致造成的初始反應(initial responses):由於沒有先例,第一回合每個人都會各自建立對他人的認知模型,並且試圖在此認知下作最佳決策:人們會從某一個簡單的行為(比方說亂選)出發,建立「最天真的人(level-0)」的行為模型。然後思考面對這種人該如何反應,建立「想一層的人(level-1)」的行為模型。但是由於每個人能夠預先設想的認知層次有限,當超過該層時,便無法再想下去。因此,只能想像對手很天真的人,就只是「想一層的人(level-1 type)」。能夠想像對手如何「想一層」的人,自己再對症下藥,就是「想兩層的人(level-2 type)」。依此類推,可以有人是想三層(level-3 type)、想四層(level-4 type)等等,正如凱因斯所說的。第二回合以後的實驗結果,行為賽局論則是提出不同的學習理論(learning theory)來解釋實驗中人們如何根據先前的實驗結果學習,一步步朝均衡移動。 這個實驗其實和股票巿場很像:當價格不斷狂飆的時候,大家都知道股巿或是房巿即將泡沫化,然而,在價格還在上漲的階段就急著下車並不是一個正確的投資策略,因為價格還會再往上漲。但是,何時下車最好卻沒有人知道,因為雖然大家都知道這個泡沫最終還是會破掉,但是沒人知道何時會發生。就好像在上述實驗中,大家一開始都不會選0,即使知道最終的均衡解是0。 35 課堂實驗的結果是許多人都猜0-30。這可能是因為該次實驗有許多研究生參與,他們事前已經知道這個實驗,所以都猜得較低,不過,平均的三分之二依然不是0。 36如果你明知道有人不會選0,那平均的三分之二一定不會是0囉!因此,你最好的策略當然是試圖去猜測大家對一般人的猜測,也就是凱因斯所說,去「預測一般人心目中認為大家公認最漂亮的會是誰。」 16
實驗經濟學方法論(王道一) 也許上述實驗太過簡化,但是真的有人設計市場實驗來研究股巿泡沫,嘗試把這種股票巿場真實的現象在實驗室中重現。在這些控制環境下的巿場中,真的會有泡沫產生,而且最後幾回合泡沫要破掉的時候,價格的確會無量下跌。有趣的是,當研究者試圖改變不同的控制變因,希望避免泡沫發生,他們發現只有一組條件可以避免泡沫產生,讓價格永遠反應基本面:(1)同一批人(2)做同一個股巿泡沫的實驗(3)重複三次,此三條件缺一不可。 必須是固定的一批人的原因是,如果只有一部分人做過這個實驗,另一部分的人沒有,那老鳥就認為那些新來的人沒經驗、還沒有想那麼多,因此自己可以憑著經驗老到去坑殺他們。必須是同一個實驗的原因則是當環境改變時,有人可能會認為自己比別人聰明,能夠更快適應新的環境,因此可以設法坑殺那些學得慢的人,所以還是會產生泡沫。至於必須要重複三次,是因為第二次可能還是存在有某些人沒有學到教訓,要到第三次才會學乖。 也就是說,實驗室中的確可以得到理想的結果:只要是同一批人、同一個實驗、重複三次,就可以使股價不泡沫化,回到基本面。可是,這些實驗也反證出在真實世界的股巿,總是會有偏離基本面的情形發生,這是因為每年都有一些經驗生嫩的新進投資人投入股巿,這就好像是上述實驗中那些被認為是「比較天真」的人。而股巿的基本面與投資環境也是瞬息萬變,即使多數人適應得很快,但還是會有一些人會故步自封。只要有這些人在,其他的老鳥就不會按照基本面投資,而是想要透過買低賣高來佔這些人的便宜。因此,股市總有人想要「養、套、殺」,新手也總是要「繳學費」。 (三)產業發展分水嶺實驗(Continental Divide) 如果你想開一家電腦公司,你會開在光華商場還是濱江花市?答案很明顯應該是光華商場,因為台灣的電腦產業剛開始發展時,就是聚集在光華商場,以致現在只要是電腦公司,都會想開在光華。反過來說,如果你想要批發花苗,你會選擇去濱江花市,而非光華商場。 產業發展分水嶺實驗(continental divide)就是一個描述這種分野的實驗。37在這個實驗中七個人一組,每個人各自從1到14選擇一個數字。每個人的報酬由自己所選的數字與全組的中位數來決定。下圖顯示這個賽局的報酬矩陣(payoff matrix)。縱軸是自己選的數字,橫軸是全組的中位數,粗體放大的數字表示給定全組中位數(同一直行)之下,讓你得分最高的數字。 37 Van Huyck, Cook, Battalio, Adaptive behavior and coordination failure, Journal of Economic Behavior & Organization, 32(4), 483-503. 17
實驗經濟學方法論(王道一) 仔細研究的話,你會發現當別人都選小的數字(中位數是7以下),那你也應該選小的數字(3到5),反過來說,當大家都選大的數字(中位數是8以上),那你也應該選大的數字(10到12)。因此,這個賽局有兩個(單純策略的)奈許均衡,一個是大家都選3,另一個則是大家都選12。由於諸多學者對均衡選擇理論莫衷一是,數學賽局論不見得能為這個賽局提供單一的預測。不過,根據效率性的均衡選擇條件,為了大家好,大家應該都會選12。 然而,實驗結果則顯示,即使經過重複幾回合的嘗試,大家仍然不一定會選到「好」的均衡(都選12)。如果一開始大家選擇的中位數是7以下,最後會跑到都選3的均衡,只有一開始選的是8以上,才會逐步走向「都選12」的均衡。也就是說,「歷史的偶然」會對長期的發展造成重大的影響;這也就是產業發展「分水嶺」的意義。 行為賽局論正在發展的各種學習理論,可以試著解釋這種被不同引力步步牽引的情形。然而,對於初始條件的產生,由於涉及共識的形成,除了前述的多層次思考之外,還可能有許多不同的解釋。舉例來說,對中國人而言,8是「一路發」的幸運數字,所以如果有許多人選擇8,最後可能就一步步走向大家都一路發「好」均衡。因為都選12的話,大家都可以拿到很高的報酬112。對西方文化來說,7是幸運的數字,但是太多人選擇7,卻是不幸的開始,會一步步帶領大家走向「壞」均衡──大家都選3,大家就只能拿到較低的報酬83。由此可知,一開始的初始條件很重要,而學習的過程也很重要。 18
實驗經濟學方法論(王道一) 四、結論 由上述巿場實驗以及三個賽局實驗可以看出,理論與實驗之間的關係十分有趣:實驗的結果有些時會驗證理論;但,有些時候實驗會得到令人驚訝的結論,與一般理論的預測不一致,也挑戰了我們熟悉的經濟學。不過,這並不代表經濟理論很差勁、不實用,反而表示經濟學家應該要寫出更好的理論,來解釋實驗中觀察到的現象。因此,實驗經濟學的目的是透過發現一致的實驗結果,來激發新的理論改進經濟學。 關於實驗的結果,有一些理論經濟學家認為難以採信,認為這些只是「玩票」。以下一一討論可能的反對理由: (1)那些沒有按照均衡來做的人是搞不清楚狀況,或是誘因不夠、沒有認真想。 這個問題的確可能存在,因此實驗經濟學家也特別針對這個問題來預防。一般在做實驗之前,實驗者都會公開朗誦實驗說明,確定所有人都聽到實驗的內容。另外,在實驗開始之前,有的實驗者則會設計一些簡單的測驗,確定受試者了解這個實驗如何進行,才開始正式進行實驗。實驗開始後,也會有「練習」的回合,讓受試者熟悉操作介面。最後,有些實驗者乾脆只採計實驗最後的幾回合,以便觀察「已經學習過」的受試者是否會按照均衡來做。因此,受試者應該不會完全搞不清楚狀況。 關於誘因的問題,有人試過把報酬金額「乘上兩倍或四倍」或者是「從無到有」,結果發現從「完全不付錢到「付一點點錢」是可能有一些差別:在完全沒有任何報酬的情況下,的確會有人亂選,但是只要有一點報酬,亂填的情況就會少很多,因為有真實的成本。而乘上兩倍或四倍的效果,會越來越小。因此,我們確實可以用花大錢來看看是否真的「重賞之下,必有勇夫」,觀察受試者是否會按照均衡的預測來選擇,但是,從現有的實驗結果來看,花大錢得到的結果,大概也不會跟付一點錢差太多。所以,要說受試者是因為金錢誘因不足才沒有按照理論預測去做,這不是一個很好的解釋。 (2)實驗設計都很糟,因此不足採信。 的確有許多實驗,不管是因為經驗不足,或者是沒有預先規劃,因此實驗設計不夠好,或者是沒有正確控制所有其他的變因,導致於實驗結果沒有明確的結論。可是,同時也有許多經過仔細設計的實驗,在嚴格的控制條件之下,所得結果就很乾淨。因此,要說「所有的實驗都很糟糕」,這樣子一竿子打翻整船人不太公平。況且,透過比較不良實驗設計與設計良好的實驗,我們可以對照出實驗設計的良窳,究竟對結果的影響有多大。 (3)受試者眼中的實驗和實驗者心目中所想的實驗內容不同。 這點很難反駁,因為實驗者的確沒有辦法完全觀察到受試者心裡在想什麼。因此,受試者眼中的實驗,可能真的和實驗者心目中的實驗完全不同,就 19
實驗經濟學方法論(王道一) 像羅貝多‧貝尼尼(Roberto Benigni) 1997年自導自演的電影「美麗人生(Life is Beautiful)」,飾演父親的導演告訴劇中的兒子他們在納粹集中營裡的生活是一個「遊戲」,使得兒子完全不覺得集中營的生活很痛苦。因此,如果我們要做的是一個研究欺騙的實驗,但是受試者卻不覺得實驗中的決定是一種欺騙,那我們就不一定能夠達到我們的研究目的。 然而,實驗經濟學還是有些辦法來偵測這種問題。首先,透過公開朗誦實驗說明等方式,正是為了讓所有人都了解實驗內容。其次,實驗者在實驗結束後,通常會以問卷的方式來收集一些基本資料,問卷上通常也會詢問受試者如何做決定。因此,雖然開放式問卷的答案通常千奇百怪,但是透過受試者自己的說法,我們也可以稍微了解他們心中對實驗的看法。最後,比較不同研究的實驗結果,或甚至是同一研究中個別受試者的不同實驗結果,我們也可以看出哪些受試者想的和大家不一樣。如果在不同實驗當中,許多受試者所做的決定都一致,但不按照均衡的預測來做,真要解釋成大家都「不約而同地想成另一個實驗」,就很難說得過去了。 (4)非理性行為就是亂選,完全無法用經濟模型分析 有些人認為經濟學「必須」假設人是完全理性,因為即便不是,完全理性也是一個很好的基準,能夠得到近似的結果;而且,我們如果假設人不是完全理性的,那我們就沒有辦法討論,因為非理性的行為都是「亂選」的,無法用經濟學的模型來分析。然而,目前實驗經濟學已經發展出許多新的理論模型來描述「非理性行為」,像是解釋初始反應的多層次思考模型、解釋人們如何朝均衡方向移動的學習模型等等。因此,「必須假設完全理性才能分析」的前提已經不存在了。 舉例來說,加州理工學院的麥卡維利(Richard McKelvey)和帕菲力(Thomas Palfrey)兩位教授在McKelvey and Palfrey (1993, 1995)提出「手滑反應均衡(Quantal Response Equilibrium, QRE)」。此一均衡是奈許均衡的延伸,但是它並不像奈許均衡、每個人都在做最適反應(best response),而是在做「手滑反應(better response)」:做決定的時候可能會犯錯(手滑),但是越嚴重的錯誤(報酬愈低),犯錯的機率越小。在手滑反應均衡下,每個人都考慮彼此可能會犯錯的情況,互相做出(可能會犯錯的)手滑反應。這樣的想法其實跟奈許均衡類似,只是更真實,考慮人可能會犯錯的事實。如果奈許是統計學家的話,他也許會發現手滑反應均衡,而非奈許均衡。38這其實就是一個從完全理性過渡到一點點不理性的理論模型,可以用來解釋不同實驗的許多結果。當然,根據不同的有限理性,模型會預測不同的結果,也許還有更好的模型是我們目前還沒想到的。因此,我們的最終的理想是:尋找一個完整的新理論來解釋最多的結果。 38 卡默勒教授曾經在不知情的情況下,在普林斯頓演講時,當著奈許的面說「奈許如果是統計學家,就可能會發現手滑反應均衡」,奈許當場並沒有發言反對。事後旁人才告訴卡默勒說奈許本人在現場,因此,至少奈許本人並沒有否認這種說法。 20
實驗經濟學方法論(王道一) 總而言之,實驗經濟學幫助我們檢驗標準經濟理論(例如數學賽局論、全面均衡理論等等)的預測,從成千上百個實驗的結果當中,歸納出一致的結果,再尋找新的理論來解釋這些結果。 五、延伸閱讀 關於臥龍‧史密斯和丹尼‧卡尼曼的貢獻,可以參考Bergstrom (2003)和Rabin (2003)對他們得獎的簡介。關於市場實驗,最早的文獻是張伯倫的Chamberlin (1948)與史密斯的得獎之作Smith(1962)。把這個實驗應用在課堂上,可以參考Holt (1996)。關於三個典型的賽局實驗,最初的原始實驗分別出自:G th, Schmittberger, and Schwarze (1982),Nagel (1995)和Van Huyck, Cook, and Battalio (1997),這裡的介紹則主要引自Camerer (2003)的第一章。手滑反應均衡請參考McKelvey and Palfrey (1993, 1995)。 Bergstrom (2003), Vernon Smith’s Insomnia and the Dawn of Economics as Experimental Science, Scandinavian Journal of Economics, 105 (2), 181 205. Camerer (2003), Behavioral Game Theory, Princeton University Press. Chamberlin (1948), An Experimental Imperfect Market, Journal of Political Economy, 56, 95 108. G th, Schmittberger, and Schwarze (1982), An Experimental Analysis of Ultimatum Bargaining, Journal of Economic Behavior and Organization, 3(4), 367 388. Holt (1996), Classroom Games: Trading in a Pit Market, Journal of Economic Perspectives, 10(1), 193-203. McKelvey and Palfrey (1995), Quantal Response Equilibria for Normal Form Games, Games and Economic Behavior, 10(1), 6-38. McKelvey and Palfrey (1998), Quantal Response Equilibria for Extensive Form Games, Experimental Economics, 1(1), 9-41. Nagel (1995), Unraveling in Guessing Games: An Experimental Study, American Economic Review, 85(5), 1313-1326. Rabin (2003), The Nobel Memorial Prize for Daniel Kahneman, Scandinavian Journal of Economics, 105 (2), 157-182. Smith (1962), An Experimental Study of Competitive Market Behavior Journal of Political Economy, 70, 111 137. Van Huyck, Cook, and Battalio (1997), Adaptive behavior and coordination failure, Journal of Economic Behavior & Organization, 32(4), 483-503. 21
實驗經濟學方法論(王道一) 本章習題: 1. 有人說:「社會現象太複雜了,所以我們不要奢望社會科學能夠預測將來,只要能圓滿地解釋過去就可以了。」你同意他的說法嗎?為什麼? 2. 你的同學說,他的經濟學老師認為經濟學不能做實驗,所以只能觀察自然發生的現象。你要如何跟他解釋你正在上「實驗經濟學」這門課? 3. 經濟學實驗跟問卷調查有什麼不同?跟心理學實驗又有什麼不同呢? 4. 你覺得當股市有漲跌幅限制,或者是禁止賣空的時候,市場價格是會波動得更厲害還是變得比較平穩?你能設計一個實驗來測驗你的預測嗎? 5. 對大學生而言,每學期開始選課大家搶課、跑加簽總是十分不方便。即使不允許金錢交易,你能夠設計一個比現行制度更好的選課機制或交換機制,使所有人都更容易選到她們想要選的課程嗎? 6. 經濟系大二必修為個體經濟學、總體經濟學和統計學,假設每門課各有五、七和三個老師各開一班。你能否設計一個保留本系名額供本系學生選填志願的「預選制度」來保證每位同學都選上他(各科)的前兩個志願?需要保留多少名額給本系生?和現行制度相比,何者較有效率? 7. 你覺得學習經濟學需要先學很多數學嗎?為什麼?你認為經濟模型用很多數學的理由是什麼?可能的問題是什麼? 8. 即使我們不認為金錢交易是壞事,如果把熱門課程的選課權利用拍賣的方式「逐一」賣出,潛在的問題會是什麼?如果是同時一起賣呢?你如何設計一個實驗來驗證你的疑慮?(提示:考慮你想「買」的課程互相衝堂的情況。) 9. 在兩人分配一百元的最後通牒談判的實驗中,如果實驗者先另外給了回應者一百元,你覺得大部分的提議者會不會願意提議五十五十對分嗎?為什麼?(你覺得大部分的回應者會不會接受「只(再)拿十元」的分配方案?)這個可能的實驗結果跟哪些經濟社會中觀察到的現象類似? 10. 如果你在選美結果預測實驗中面對一群台大醫科的學生,你會選多少?跟你面對你的國中同學一樣嗎?為什麼?你覺得在台北股市進行交易比較像面對一群台大醫科學生,還是你的國中同學?其他地區的股市呢? 11. 不同國家的經濟發展通常南轅北轍,即使一開始起跑點類似,有些國家經濟可以起飛、成為亞洲四小龍,有些則是原地踏步,甚至落入「貧窮陷阱(poverty trap)」。你如何設計一個實驗來研究兩種國家的不同結果? 12. PTT的經濟板上有人說,經濟學一定要假設人是理性的,不然就沒有辦法分析。你要如何跟他解釋行為賽局論可以描述許多「人可能會犯錯」的情況? 22
實驗經濟學方法論(王道一) 課堂實驗(一):市場交易──發現「看不見的手」(Seeing the Invisible Hand) 我們將選出四十位同學參與交易實驗,其中二十位同學為買方,剩下二十位為賣方。每位同學會拿到一張有數字的撲克牌。(J代表11,Q代表12,K代表13,但A代表1) 拿到紅色(方塊、紅心)的是賣方,拿到黑色(黑桃、梅花)的是買方。請收好這張牌確保別人無法看到牌上的花色數字。每張牌代表你們可以買賣的某商品一單位。 賣方:每一位賣家每回合可以賣出一單位的某商品。牌面數字乘以十代表的是您賣出一單位所需要付出的生產成本,因此您賣出一單位的利潤就是您所賣出的價格減去牌面上的數字乘以十。如果您沒有達成交易,您該回合的利潤就是零,但也不必負擔任何成本。舉例來說,如果您拿到的卡片是紅心二,而您賣出某商品的價格是三十元,那您的利潤就是十元。 買方:每一位買家每回合可以買進一單位的某商品。牌面數字乘以十代表的是您如果買到了該物品,您會獲得的價值,因此您的利潤就是牌面上的數字減去您所買進的價格。如果您沒有達成交易,您該回合的利潤就是零。舉例來說,如果您拿到的卡片是黑桃九,而您買進某商品的價格是四十元,那您的利潤就是五十元。 交易規則: (A) 自由談判:所有的買家賣家有五分鐘的時間自由個別談判,如果兩個人達成協議,就請到前面來向實驗者申報交易並繳回撲克牌。談判時不能強迫,申報之後亦不能反悔。實驗者會在黑板上寫下並宣告交易價格。 (B) 看得見的手:實驗者充當交易員,聽取買賣雙方舉手喊價:「X元買進」或「Y元賣出」,並紀錄在黑板上。如果有買家或賣家願意接受另一方的喊價,則喊「成交」。成交後,雙方到前面來向實驗者申報繳交撲克牌。每次成交後再重新開始下一單位的喊價。 利潤記錄與結算:每回合後,請在記錄表上填入報酬(賣方則填入成本)和成交價格,並計算本回合的利潤。最後的總利潤除以十五則是您所獲得的分數。您的分數越高,成績越高。 23
實驗經濟學方法論(王道一) 發現「看不見的手」實驗紀錄表 姓名:_______________ 系級:_________________ 學號:____________ __ 回合數 交易規則 買方報酬 價格 賣方成本 本回合利潤 備註 1 自由談判 2 自由談判 3 看得見的手 4 看得見的手 總利潤 24