勞動經濟學的實驗研究方法
閆威 陳長懷 韓美清
摘要:在過去的幾十年中,實驗研究方法在經濟學特別是勞動經濟學領域中的應用呈穩步增加的態勢。較之于其他實證研究方法,實驗研究方法的優勢主要在于能夠對相關影響因素進行更為嚴格的控制,并能可靠地預測變量之間的因果關系,同時實驗本身具有的可重復性也使研究結論更易于驗證。目前學術界仍存在著一些反對實驗研究方法的意見,如實驗被試的選擇偏差,被試所獲得的支付水平的高低,觀測的數目以及內、外部有效性等。 關鍵詞:勞動經濟學;實驗研究方法;應用 Abstract:In the past few decades, experimental research methods showed a steady increase trend in economics, especially in the field of labor economics. Compared to other empirical research methods, the major advantages of experimental research method are the ability of more strictly controlling the related factors, reliable prediction of causal relationship between variables, and the easier research findings validation because of repeatability of the experiment itself. At present, there are still a number of academic research methods against the experimental observations, such as the selection bias of experimental subjects, the high or low of payment level obtained by subjects ,the number of observations, as well as internal and external validity. Key words:labor economics;experimental research methods;application 一、實驗研究方法的優勢 理論檢驗在科學進步中發揮著關鍵作用,研究者可以利用不同數據源實現對理論的檢驗。這些數據來源大致可按兩個維度進行劃分(Friedman and Sunder,1994):一是實際數據(happenstance data)和實驗數據(experimental data);二是實地數據(field data)和實驗室數據(laboratory data)。實際數據是未加控制的、自然發生的經濟活動的副產品,而實驗數據是在受控條件下,為了明確的科學目的而人為創造的。實地數據來源于自然環境,而實驗室數據來源于實驗室環境。這兩種維度的數據可構成四種組合數據。 長期以來,經濟學被看作是運用實地實際數據來進行研究的“非實驗性”科學,如失業率、工資水平、教育年限和收入水平等均屬于實地實際數據。既然實地實際數據如此豐富,為什么還要千方百計地進行實驗并創造自己的數據呢,本文將從三個方面分析實驗研究方法在勞動經濟學研究領域的優勢。 (一) 實驗研究對相關影響因素的嚴格控制 錦標賽理論得名于體育比賽,是指員工通過競爭以獲得某項獎勵(如薪酬增加或晉升),勝出者由相對績效排序決定。在錦標賽理論中,員工的均衡努力水平被定義為邊際努力成本等于邊際收益時的努力水平。邊際收益取決于獎金數額以及獲勝的機率,并與后者呈負相關關系(Lazear and Rosen,1981),給定均衡努力的選擇就可以直接導出最優獎勵的水平和結構。現以錦標賽理論的檢驗闡釋實驗研究具有可控制性的潛在優勢。 若對錦標賽理論進行直接的實證檢驗,首先要求研究者知道參與競爭的員工數目,獎勵的確切大小,員工努力的成本函數,以及生產函數(包括誤差項的性質)。同時,為了確定最優獎勵水平,還需要了解企業的支付函數與員工的參與約束。所有這些信息在實驗室實驗中都是確定的,研究者可以清楚地予以設定。通過觀察實驗被試所選擇的努力水平和獲獎情況,就有可能對最優報酬作出精確地預測并進行檢驗,而采用實地實際數據對錦標賽理論進行直接檢驗幾乎是不可能的。因為當使用實地數據時,研究者很少能確切地知道以上提及的各種因素;而且研究者也很難保證實地環境與理論假設的環境高度相似。例如在錦標賽理論中,一個顯而易見的事實是,如果員工在競賽中有消極的破壞競爭對手績效表現的行為,努力與獎勵的最優水平同不存在破壞行為情況下的結果將是大相徑庭的。 相同的道理,使用實地數據的研究者很少能知道員工與企業之間的互動是一次博弈還是重復博弈,然而重復博弈的理論預測往往明顯不同于一次博弈的結論。還有其他一些重要因素,如員工彼此之間了解程度如何?員工之間的溝通及同伴壓力怎樣,有無形成共謀的可能?員工之間的互動方式是公開還是匿名?在實地實驗中,以上因素及其他環境細節都會影響研究對象的行為,卻不能被有效控制。與之相反,在實驗室實驗中,這些環境因素能夠被嚴格控制,因此能夠進行系統的研究。例如,在實驗室實驗中,對一次博弈與重復博弈情形進行比較研究,或者對匿名互動與“面對面”互動關系進行比較研究,將是非常方便的。 當然,這種能對影響因素進行更好地控制的優勢不局限于錦標賽理論的研究。例如,在關于不同行業間工資差異的爭論中,很難判斷所觀察到的差異是反映出的真實“租金”,還是不可觀察的異方差性 (Gibbons and Katz,1992)。同樣地,幾乎不可能依據實地數據來判斷失業是自愿的還是非自愿的,即很難判斷失業員工在低于現行工資的情況下是否真的愿意繼續工作。然而,在勞動力市場中采用實驗室實驗研究,控制員工的外部選擇,則能對上述問題輕易作出回答(Fehr and Falk,1999)。以上例子極具說服力地表明,實驗室研究較之于實地研究,能對相關影響因素實施更好的控制。 (二)實驗研究能夠推斷變量之間的因果關系 實驗室實驗的另一個主要優勢在于形成因果關系推論的可靠性。在實地研究中,許多有意義的變量是內生決定的,多數情況下最多也只能確認變量之間是相關的,而很難確認變量之間的因果關系。然而通過合理的實驗設計,我們可以有把握地推斷變量間的因果關系。實際上,實驗研究是確認變量間因果關系的最有效手段。 (三) 實驗研究的結論易于重復驗證
實驗研究具有易于復制的特征。傳統的經驗數據作為檢驗數據,具有不可重復性的缺陷,即所謂的“歷史不能重演”。而對理論的證實或證偽都需要大量的檢驗。Smith(1962)指出,實驗研究的可重復性克服了所有觀察結論所普遍存在的一次性的缺陷。其他研究者可以很容易地復制實驗設計,進行獨立驗證,從而證實或者證偽專題研究中得出的結論。實驗數據的應用可避免某些理論沒有經過一個可重復的嚴格證明或證偽的過程而被稱之為所謂的“傳教士的理論”。 二、實驗研究方法的反對意見 首先,由于實驗中的被試常常為學生,實驗研究常被批評存在被試選擇偏差,批評者認為學生對所要研究的問題缺乏實踐經驗。其次,主要針對實驗中的支付(payoff)問題,由于一般情況下被試在實驗中獲得的支付較低①,他們可能不會以嚴肅認真的態度進行決策。第三種批評主要針對被試數目太少的問題,實驗研究結論往往受到置疑。第四種批評主要來自于實驗研究結論能否推而廣之,對現實是否具有預測和指導作用,即實驗研究的外部有效性問題。盡管這些批評有一定的合理性,但是不具有根本性的意義,因為通過細致周詳的實驗設計,這些問題完全可以克服和解決。 (一) 被試選擇偏差 研究者之所以選擇學生作為被試,主要是出于方便性的考慮。學生容易招募,能夠迅速理解實驗規則,而且他們的機會成本相當低。但是,并沒有根本的理由來排斥其他對象,而且非學生被試的使用也在逐漸增加。其次,通過細致周詳的實驗設計和與實施,有可能發現不同被試樣本在行為上的有趣差異。List(2003)對市場經驗是否能消除稟賦效應問題進行了研究。Cooper et al(1999)利用中國學生和中國中層經理作為實驗被試,檢驗了起源于效率工資激勵的棘輪效應理論。同樣地Fehr and List (2003)以企業CEO作為實驗被試,研究他們使用顯性激勵方式的程度以及如何對這種激勵作出反應。 List(2003)的研究結果表明缺乏市場經驗的經紀人表現出了稟賦效應,而在擁有市場經驗的經紀人身上卻沒有發現這種效應。擁有市場經驗的經紀人之所以沒有體現出稟賦效應,不是由于選擇效應,而是由于市場經驗本身。Cooper et al (1999)在實驗研究中觀察到,經理和學生的行為在很大程度上收斂于混同均衡。因此,被試樣本之間的行為差異隨著時間的推移而消失。在實驗的初期,他們觀察到不同樣本之間的確存在一些差異。但是,如果實驗指導語用一種抽象的、無關經理決策的具體環境的語言來描述,那么學生的行為較之于經理將更快地收斂于均衡點。相反,如果實驗指導書中含有大量的與企業計劃者和經理間的相互作用相關的內容,那么,經理的行為將更快地收斂于均衡點。Fehr and List(2003)發現學生和CEO之間的確存在行為差異,CEO明顯比學生更信任他人,而且也更值得他人信任。雖然如此,兩個被試樣本仍然作出了使用顯性激勵方式的相同選擇,盡管該方式有很大的負面影響。 這些例子均表明,被試樣本差異可能是一個現實問題。但是,這些研究也顯示出了不同的被試樣本在行為上并沒有表現出根本性的不同。在Cooper et al(1999)的研究中,學生和經理們的行為在經過一段時間后是高度相似的。同樣,在Fehr and List(2003)的研究中,根據理論推斷,如果假定所有實驗的參與者是完全自利的,信任行為則不會存在,但作為被試的學生和經理們都表現出了非常強的信任行為。此外,兩類被試樣本都顯示出大量利他的、互惠式公平的行為。因此,雖然存在某種程度上的被試樣本選擇偏差,但是不同樣本的行為從本質上來說卻是非常相似的。 (二) 被試所獲支付較低 被試在實驗中所獲得的支付水平(stake level)較低也是一個非常重要的問題,研究者一致認為更高的支付水平能顯著地降低被試行為的方差(Camerer and Hogarth,1999)。這就表明當被試在實驗中能獲得更高的利益時,他們會以更加認真的態度參與實驗。但是Camerer and Hogarth(1999)在回顧了大量檢驗支付大小效應的研究后發現,核心的行為趨勢極少因為支付水平的變化而改變。盡管支付(利益)對于實驗被試而言是重要的,但是,利益大小的變化往往不會改變核心行為趨勢。一個有趣且重要的例外出現在Holt and Laury(2002)的研究彩票選擇實驗中,隨著平均支付從70美元增加到230美元,實驗被試表現出明顯增強的風險厭惡型特征。相反,在公平偏好實驗中,支付水平的增加很少或者不會影響公平行為反應的發生。 (三) 被試樣本量太少 關于實驗被試樣本數量較實際數據過少的問題也是能夠克服的。首先,增加或補充實驗的觀測數目是可能的;其次,以國家宏觀經濟中的代表性問題為對象進行大規模的實驗研究也已成為可能。近來,Harrison ,Lau and Williams(2002)采用丹麥人口總體的一個典型樣本,推導出了貼現率;而Bellemare and Krger(2003) 則以荷蘭為樣本,進行了信任博弈的實驗。其研究結論顯示并不存在被試選擇偏差。 (四)外部有效性問題 對實驗室實驗更為普遍的批評涉及到內、外部有效性問題,內部有效性指從某一實驗中獲得可靠性的原因和結論的可能性,而外部有效性是指從試驗研究的外部環境聯系中歸納出可靠結論的可能性。內部有效性涉及到的只是一個合適的實驗控制、敏感度設計及正確的數據分析問題,相對而言,外部有效性的問題則更為嚴重。批評者認為把實驗室的研究結論推廣到實地中去,其可能性是非常值得懷疑的。 外部有效性主要涉及兩個問題。第一,從一般意義上說,當歸納法原理成立時,外部有效性將會是較高的。根據這個原理,只要絕大部分相關的潛在條件保持不變,那么,行為規則在新環境中也會持續不變。存在這樣一個事實,即便保持所有條件不變,也難以保證實驗結果在現實環境中可以被完全復制。雖然這個說法是正確的,但是這種批評也不是僅僅針對實驗研究。事實上,沒有任何實證研究能夠確保在同樣的條件下復制出完全相同的結果。第二,實驗研究是否抓住了現實中的主要條件。置疑者認為某些實驗因為忽略了現實中的許多關鍵性特征,從而不具有外部有效性,也就不符合實際情況。實驗研究者的回答往往是盡可能模擬出這些被忽略的條件。但是,從某種意義上來說,實驗研究和經濟學模型一樣都是不太現實的,因為它們都是對現實的高度抽象,這種抽象也正是一種優點,惟其如此才能夠使人們增加對相關變量之間相互作用機制的理解。由于對現實性的強調實際上取決于實驗的目的,在很多情況下實驗研究的目的就是為了檢驗理論,或者理解理論失靈的原因。因此,實驗證據對理論構建非常重要,但是對理解現實卻不那么重要。 三、增加實驗研究現實性的途徑 (一)實地實驗 無庸置疑,實驗的可控性是其主要優勢。然而關于實驗室環境和現實生活環境是否一致的問題,可能將備受爭議。可以說實驗室實驗不是對傳統的實證經濟分析方法的替代,而是對其的有益補充。將二者有機結合的方法之一就是進行實地實驗,讓研究者在自然的環境中研究經濟主體的行為。Falk and Ichino(2003)進行了一個典型的實地實驗——將實驗控制和現實環境的優點結合起來,研究同伴壓力對工作行為的影響。實驗是在日常工作環境中進行的,被試被分為處理組和控制組,其產出被分別測量。在處理組中,兩個被試在相同的房間中一起工作;而在控制組中,每個被試分別在一個房間內單獨工作。從技術上來講,實驗被試所從事的任務彼此完全獨立。研究結論之一顯示,與被試單獨工作情形下的產出相比,隨機選擇的配對被試工作時的產出有了顯著的增加。在另一個實地實驗中,Fehr and Gtte(2002)研究了一個企業中員工的工作時間和努力的跨期替代問題。在某一段時期內,他們對公司的一半員工按照更高的計件工資給付薪酬,而對公司的另一半員工按照固定的計件工資支付。采用這種方式,他們創造一個控制組和一個處理組,用以測量計件工資的增加對勞動力供給的影響程度。
(二)“真實努力”實驗 使實驗室實驗環境更貼近現實的另一個途徑是進行所謂的“真實努力”實驗。在一個典型的實驗室實驗中,工作努力的選擇由一個遞增的貨幣函數來表示,被試不是選擇真實的努力水平,而是選擇一個有經濟意義的數字。這種方法被廣泛應用于錦標賽實驗中(Bull et al.,1987)和效率工資實驗中(Fehr and Falk,1999)。然而在“真實努力”實驗中,努力代表的是完成一種真實的任務。例如,在Fahr and Irlenbusch(2000)的研究中,實驗被試的任務是剝胡桃;van Dijk,Sonnemans and van Winden(2001)要求實驗被試利用計算機解決難度較大的雙變量優化問題;在Gneezy(2003)的研究中,實驗被試需在計算機上解決“迷宮”難題。“真實努力”確實能夠增強實驗的現實性,然而需要指出的是,這是以失去可控性為代價的——因為如果實驗者不了解員工的努力成本,那么也就不可能得出準確的數量預測。 (三)項目評價實驗 實驗技術在項目評價領域也具有很高的價值。不幸的是,基本上不能夠獲得來自隨機的大規模社會項目實驗的數據,尤其是在歐洲,政策制定者對實施這樣的社會實驗往往持著猶豫不決的態度。盡管如此,研究者自己收集數據也是可能的。例如,Falk et al(2002)提出了一個新穎的項目評價方法,它允許在弱假設條件下確認參加培訓項目與被邀請參加面試的可能性之間是否存在因果關系。基本思想是通過在較短的時間間隔內對參與項目的同一個體實施前測和后測,以此對項目進行評價。其程序如下:首先,研究者招募一些失業者參與一個特定的培訓項目,然后在這些人完成培訓課程之前,向外投遞求職申請書。當這些人已經成功完成培訓課程并獲得證書后,又發出第二次求職申請。兩次求職申請內容完全一樣,只是第二次多了一個課程證書而已。由此可以檢驗參加培訓項目對獲邀參加面試的概率是否有影響。相似的方法已經應用于對女性員工的歧視(Weichselbaumer,即出)和失業粘性的(OberholzerGee,2000)的研究。 四、展望 過去的20多年,經濟學領域的實驗研究獲得了突飛猛進的發展,其應用也呈現出穩步增加的態勢,這種增加的趨勢將持續下去。事實上,2002年諾貝爾經濟學獎授予Daniel Kahneman和Vernon Smith,可能使實驗經濟學家們獲得更廣闊的舞臺。實驗研究方法在諸多經濟學領域都大有用武之地,其中很多領域都與勞動經濟學相關。值得注意的是,經濟理論與實驗方法不可偏廢,二者各有所長,相得益彰。經濟理論使我們能夠在制度或者參數族(如稅率)的框架下對經濟行為作出合理的預測,而實驗方法能夠為不同制度環境的運行效果提供經驗證據,從而對經濟理論進行檢驗。此外,在實驗過程中對于人類行為的觀察,也將促使研究者更嚴肅地對待個體動機和有限理性問題。從長期來看,這有助于我們對人的本性進行更現實的刻畫。實驗研究已經成功地應用于公平、互惠、損失規避、過分自信、非指數貼現等現實經濟社會現象,通過研究它們對激勵和契約的影響,對組織設計的影響,以及對勞動力供給和需求的影響,可以大大增進對企業、家庭與勞動力市場運行機制的理解。 注釋: ① 一般而言,研究者為了模擬出真實的市場環境,往往為被試在實驗中的績效表現支付一些數額不大的報酬,以增強所研究問題的現實相關性,提高被試的認真程度,并以此確保實驗研究的信度和效度。