首頁 > 文章中心 > 博弈論在管理學中的應用

          博弈論在管理學中的應用

          前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇博弈論在管理學中的應用范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

          博弈論在管理學中的應用

          博弈論在管理學中的應用范文第1篇

          一、博弈論的形成和發展

          1、博弈理論的早期研究。一般認為,對于博弈理論的最早研究可以追溯到18世紀初。瓦德格拉夫(Waldegrave)在1713年提出了兩人博弈的極小化極大混合策略解。古諾(Cournot)和伯特蘭德(Bertrand)分別在1838年和1883年提出了博弈論最經典的模型,兩位學者分別從產量決策和價格決策分析壟斷的雙寡頭競爭模型,確定了在競爭之下各自的最優反映函數。這些都是關于博弈問題的早期的零星研究。

          2、博弈論發展的不同階段。一般認為博弈論萌芽于20世紀20年代初。博弈論創立的標志是馮?諾伊曼和奧?摩根斯坦(Morgenstern)在1944年的《博弈論與經濟行為》這部著作,他們的貢獻現在看來主要是創立了博弈論研究的基本概念、二人零和博弈的完全解決和對合作博弈的貢獻。現在應用更為普遍的非合作博弈理論的創立,則是以納什(John Nash)1950年的博士論文《非合作博弈》為標志,該文的主要貢獻是提出了納什均衡的概念。此后(20世紀70年代),美國海薩尼(Harsanyi)和德國塞爾頓(Selten)的不完全信息博弈理論工作進一步完善了非合作博弈理論。當20世紀70年代經濟學家開始將注意力由價格制度轉向非價格制度時,博弈論逐漸成為經濟學的基石。

          1944年,馮?諾伊曼(Von Neumann)和奧?摩根斯坦(Morgenstern)合著的《博弈論與經濟行為》被認為是博弈理論初步形成的標志。該書在總結以往關于博弈的研究成果的基礎上,提出了博弈論的概念術語、一般框架和表述方法,提出了較系統的博弈理論。而且,在該書以前,博弈論主要是數學家們研究的課題,主要是一種數學理論而不是經濟學理論。《博弈論與經濟行為》極大地促進了博弈論和經濟學研究的聯系。從此,博弈論開始被經濟學家們所接受,對博弈論的發展起了巨大的推動作用。雖然《博弈論與經濟行為》的出版標志著博弈論的初步形成,但是這個時候的博弈論還是比較幼稚的,研究的范圍也較小,總體影響也很小。研究的主要對象是少數類型的合作博弈和零和博弈。

          20世紀的40年代末到50年代初,是博弈論的發展史上一個重要階段。越來越多的學者進行了博弈理論的研究。1950年,納什(John Nash)在他的博士論文《非合作博弈》中,將博弈論擴展到了非零和博弈,最終形成了非合作博弈理論的思想源泉,納什均衡概念的提出以及納什均衡存在性的納什定理的證明,發展了以納什均衡概念為核心的非合作博弈理論。納什均衡是對古諾模型和伯特蘭德模型中均衡概念的一般化,納什均衡的概念是有關均衡概念的最基本的概念,后來的子博弈精煉納什均衡,貝葉斯納什均衡、精煉貝葉斯納什均衡等概念的提出都是以納什均衡為研究出發點的。

          20世紀50年代中后期一直到70年代也是博弈論發展歷史上較為重要的一個時期。“微分均衡”、“強均衡”、“重復博弈”以及在此基礎上的完全信息動態博弈等概念就是在這一時期提出來的,而且在60年代初開始了博弈論在進化生物學中的應用的研究。這個時期產生的里程碑式的成果是海薩尼(Harsanyi)關于不完全信息博弈理論,他在1967-1968年的三篇關于不完全信息博弈理論的論文中,提出了關于不完全信息靜態博弈的“貝葉斯納什均衡”的概念,此外還在1973年提出了關于“混合策略”的不完全信息解釋,以及關于不完全信息動態博弈的嚴格“納什均衡”概念。同時這個時期也是進化博弈論發展的重要階段,提出了“進化穩定策略”等概念。當然,這個時期產生的博弈論成果還有很多,博弈論更多地應用到經濟學理論的研究當中,為80-90年代博弈論的成熟以及經濟學理論的博弈論革命起了很大的推動作用。

          20世紀80-90年代到現在是博弈論走向成熟的時期,期間產生了大量的研究成果和文獻,表明博弈論已經作為一種一般的分析方法逐漸走進了政治學、軍事學、生物學、統計學等多門學科中。尤其是在經濟學中,博弈論占據了核心地位。這個時期,是對非合作博弈理論的進一步深化,產生了博弈論基礎上的經濟學分支,如信息經濟學,以及一些關于特殊問題的理論,如拍賣理論、激勵理論。早在1983年,因一般均衡理論而得到諾貝爾經濟學獎的德布魯(J?Debreu)表明,如果沒有博弈論中納什均衡的重要概念,也就沒有他對一般均衡的存在性的證明。到了90年代,克萊普斯(D?Kreps)、克魯格曼(P?Krugman)和格羅斯曼(S?Grossman)都是因為在博弈論上的貢獻而獲得了美國的克拉克獎(Clark Prize),這是美國對40歲以下經濟學家的最高獎。之后,博弈論兩度奪得諾貝爾經濟學獎,1994年頒給納什(Nash)、海薩尼(John Harsanyi)和塞爾頓(Reinhard Selten)三位博弈論專家;2005年頒給羅伯特?奧曼(Robert J?Aumann)和托馬斯?謝林(Thomas C?Schelling )。

          二、博弈的類型及其均衡概念

          博弈理論有合作博弈和非合作博弈之分。合作博弈強調團體理性,強調效率、公平和公正,非合作博弈更強調個體理性、個體的最優決策。按照參與人行動的先后順序,博弈可以分為靜態博弈和動態博弈。完全信息博弈是指每個參與者對所有其他參與者的特征、策略空間和支付函數有準確的知識;否則,就是不完全信息博弈。下圖是基于上述分類方法的博弈類型以及各自的均衡概念。

          三、博弈論的研究趨勢及未來

          1、合作博弈和非合作博弈之分。博弈論有合作博弈和非合作博弈之分,現在的研究更多地是基于非合作博弈的研究,事實上合作博弈也是博弈理論的重要內容。當前合作博弈理論研究的落后,正說明這個領域有很大的發展潛力,基于這方面的研究可能會帶來博弈理論以及經濟學理論的重大革命。

          博弈論在管理學中的應用范文第2篇

          作者:,上海財經大學公共經濟與管理學院助理教授、碩士生導師 上海 200433

          [摘 要]本文對當代西方主流的政治學與公共管理學研究中常用到的“規范研究”的方法進行了簡明的介紹。文章從規范研究的基本假設談起,指出在最基本分析單位應當有內在一致性和應當是理性的假設條件下,規范研究大致可從效用理論和博弈論兩個方向來進行,而究竟選取哪一個方向則取決于研究者關注的是單一主體在決策時的不同選擇還是多個主體在尋求均衡路徑中的互動。文章還探討了規范研究的隱含假設,并勾勒了一個典型的規范研究的操作框架。文章最后探討了對于規范研究不同模型的評價原則,及如何構造一個規范研究的模型。

          [關鍵詞]規范研究;模型;效用理論;博弈論

          [中圖分類號]D035 [文獻標識碼]A [文章編號]1006-0863(2014)02-0074-05

          一、引言

          在政治學與公共管理學的研究中,除了我們所熟知的量化研究和質性研究的方法之外,當代西方主流的學術期刊上還時常用到一種被稱為規范研究 (formal theory) 的方法,規范研究在我國臺灣學術界又被稱為形式理論。[1] 規范研究或形式理論(以下皆稱為規范研究)最大的特色就是用數理的模型來分析主體的行為。需要注意的是,本文關注的“規范研究”應當與另一個常用的“規范性理論”(normative theory)的概念區分開。“規范性理論”有一個對于世界應該如何的價值判斷,在公共行政學中,規范性理論與實證研究是兩條研究路徑, 相對于以經驗為基礎,運用自然科學方法的實證研究,規范性理論是一種以價值問題為核心關注點、以解讀和詮釋文本為主要表現形式、通過嚴謹的邏輯構造來回答某個學科的基本問題乃至人生與世界的“大問題”的研究路徑。[2]而“規范研究”則通常從不言自明的公理出發,按照嚴格的數理邏輯和設定規則推演出世界應該如何。這些推演和對于應然狀態的判斷再反過來用實證的方法進行研究。

          雖然很多所謂的規范性理論的文章事實上是不嚴謹的學術研究,但這不影響規范性理論的文章在我國目前的公共行政學的文獻中占據主流地位這一事實。[3][4]如本文將要介紹的“規范研究”在不少關于行政學研究方法的討論中還不被單獨列為一個類型。[5][6]然而有一些學者已經開始用符合“規范研究”要求的方式寫作。如楊立華構建了一個知識困境的博弈模型來理解如何通過提高個體對博弈對方知識的尊重和認同,同時加強相互之間的知識交流和溝通,來走出由于知識困境而導致的知識成員之間的矛盾、沖突和對立。[7] 郭慶松討論了如何通過分析勞動關系的博弈規則來確定勞動關系的博弈均衡,從而促進勞動關系利益主體效用函數的實現或預期收益的最大化。[8]

          用數理模型來分析的好處顯而易見。數學作為符號邏輯,理論上講日常語言可以表達的一切都能轉化成數學這種符號邏輯。而數學相對日常語言來說,其結構性、工具性、操作性更強,有利于對復雜現象的溝通,及對事物的控制。就易于溝通而言,比如,一個普通的中國人可能并不懂瑞典語,但如果有基本的數理訓練的話,他可以很方便的理解瑞典人寫的規范研究的模型。

          最早的規范研究的著作見諸于經濟學的文獻中,如古諾(Cournot)[9] ,伯川德(Bertrand)[10] ,和埃奇沃思(Edgeworth)[11] 關于壟斷定價和生產的論文。約翰?馮?諾伊曼(John von Neumann)和奧斯卡?摩根斯坦(Oskar Morgenstern)1944年在《博弈論和經濟行為》一書中提出大部分經濟問題都應當被當作是博弈來分析[12]。 而在政治學與公共管理學界,四本巨著可以被認為是規范研究的應用的奠基之作。它們是,安東尼?唐斯(Anthony Downs)的《民主的經濟學理論》 [13],鄧肯?布拉克(Duncan Black)的《委員會與選舉理論》 [14],威廉?賴克(William H. Riker)的《政治聯盟的理論》 [15] 及詹姆斯?布坎南(James Buchanan)與戈登?圖洛克(Gordon Tullock)的《同意的計算――立憲民主的邏輯基礎》 。[16] 大批后來的學者繼續用規范研究的方法發展自己在各個方面的理論,如關于經濟和政治的發展有曼瑟爾?奧爾森(Mancur Olson)的《國家的崛起與衰落》[17],關于官僚體系有威廉?尼斯卡寧(William Niskanen)的《官僚制與代議制政府》[18], 關于利益集團有奧爾森的《集體行動的邏輯》[19], 關于民主理論有賴克的《自由主義與民粹主義》[20], 關于合作行為的演變有羅伯特?阿克塞爾羅德(Robert Axelrod)的《自由主義與民粹主義》[21] 等。

          二、規范研究的基本假設

          我們知道,統計分析的核心是歸納,也就是說,從繁多的資料中整理出相關變量間系統的聯系。而規范研究的核心是演繹,即從設定的模型出發,推演出主體在模型的約束條件下根據一定規則如何達到自己的目的。具體的規范研究有各自不同的模型,但所有的模型基本都遵循幾個假設。其一,模型的最基本分析單位應當有內在一致性;其二,基本分析單位的行為應當是理性的。

          是否具有內在一致性,主要指標是分析單位有沒有自己的行為目標。同一個分析單位在同一個時段內,行為目標應當是確定的。假如在研究的時段內,這一個分析主體的目標是游離的,那么,這個主體就不應被作為規范模型的最基本單位。一個有內在一致性的分析單位(或主體)可以是一個人,或一個群體,或一個國家,甚至一個國家聯盟。但這些單位未必任何時候都有內在一致性。比如,如果一個人既有利己性,又有利他性,那么我們必須嚴格設定我們的規范模型到底是在描述利己時,還是利他時的個人。這樣,我們才能得到前后一致的模型。

          如果分析主體為了達成既定目標而采取最優的方式,我們就認為這個分析主體是理性的。注意這里的理性有可能與我們通常理解的“理性”有一些出入。比如,二戰末期日本軍隊采用了神風敢死隊的方式與對手作戰,我們通常會認為這是瘋狂和“不理性”的作戰方式,但如果我們把它理解為分析主體(神風敢死隊隊員)為達成既定目標(最快和最大限度的打擊對手),那么在當時的限定條件下,同歸于盡也許是他們能采取的最優選擇。

          三、規范研究的分類

          常見的規范研究大致可分為兩大類,一種是效用理論(utility theory),另一種是博弈論(game theory)。效用理論同時也是博弈論的基礎,它用數學理論來表達決策過程。[22]對于一個理性的主體而言,他有趨利避害的本能。效用理論假設理性主體的偏好是不變的,它會首先設定理性主體的目標是什么,再指明主體的各種行動的后果是什么。因為主體對各種后果的偏好不同,我們可以用一組從小到大的數值來表明主體對各種后果到底有多么偏好,這些數值就是效用。把主體對各種后果的偏好與這些數值對應起來的公式就是效用函數。最后,各種后果的出現是有一定的概率的,主體會根據這些概率而冒著相應大小的風險來采取產生不同后果的行動。效用理論這時就能夠給我們一個科學的決策指南。我們可以將所有不同行動的效用與所有不同行動的風險分別相乘,以得到每個行動的預期效用。理性的主體將會選擇產生最大預期效用的行動。

          但社會科學里最流行的規范研究的類型還當數是博弈論了。與其它的研究方法,如效用理論或統計分析相比,博弈論最大的特色是把分析主體的互動納入到模型中。這樣,主體間策略性的行為就能被模型所解釋:我的選擇是如何因為你的選擇而改變,與此同時你的選擇又是如何因為我的選擇而改變;為了實現目標,因為我預期你會如此行動,所以我策略性地沒有選擇短期內的最優行為;而你由于預期到我不會采取短期最大化的行為,也策略性地選擇與短期最大化不同的另一套應對;如此這般。這樣,博弈論的構架本身自然而然的迫使我們直面決策行為的“內生性”,也就是說,決策不是一成不變,而是隨著模型內其他變量的改變而不斷變化。博弈論相信,當博弈終止,塵埃落定之時,理性的局中人將已經把所有可能的信息納入到最終決策之中了。所以,最終各方的決策應當是均衡的,即,沒有任何一方愿意改變現狀,從而進入重新一輪的博弈。雖然,根據博弈論理論,理性主體的行為最終將落在均衡路徑之內,但博弈論的框架要求我們不得不考慮在均衡路徑之外的,理論上不會發生的決策與行為。因為這樣才能幫助我們得到模型的最終解答。

          除此之外,近些年規范研究也開始向新的方向發展,值得注意的有兩個方向。第一,規范研究開始注意與實驗的方法相結合。[23] 后面將會介紹,規范研究大多是從一些基本的假設出發開始推演的;但當假設并不契合實際時,結論將會偏差。對于在受控的環境下的受試者,研究人員可以用多種方式檢驗假設及結論的可靠性,并利用這些反饋修正自己的規范研究的模型。第二,政治學與公共管理學研究中一種新興的網絡分析法(network analysis),可以被視為是規范研究的一類分支。[24] 網絡分析法明確地把主體放在一個社會關系的網絡之中,主體的每一個社會關系都是網絡中的一條線,主體本身是網絡中的一個節點。關系的演變將依據研究者給定的假設與邏輯。由于任意一點都可能與多點相連,任意一點的決策將受到多種輸入的影響,但這個決策也會反過來影響其他點,因此網絡分析法充分的體現了社會內主體間的相互依賴(interdependency),對理解許多政治與經濟問題有重要意義。

          表1 規范研究分類

          (一)著名的博弈論模型

          最著名的博弈論模型恐怕非“囚徒困境”莫屬了。最原始的囚徒困境模型是兩個囚犯被隔離訊問,招認就能減低刑期,不招會被罰,并假設只要一人招認,檢察官就有足夠證據能處罰兩個人。當兩人都招時,兩人都會中度受罰,但當兩人都不招,則檢察官只能輕罰兩人。重點在于,如果只有其中一方招認,招的那一方就能獲釋,不招者則得到重度懲罰。每個人都會去想對方到底招不招,然后發現,不論對方招不招,我自己招認的好處都大于不招,所以兩人基于理性,就各自發展出主導策略,即都選擇招認,因此兩人都受到中度懲罰。

          表2 囚徒困境

          注:括號內是兩人的所得,越大的數字表明越大的所得。括號內左邊的數字是囚犯一的所得,右邊是囚犯二的所得。但假如囚徒困境的情形要重復不斷地進行,最理性的方式則是大家形成合作的默契,都不招認,因此都只受到輕度懲罰。假如默契不形成,兩人每次都受到中度懲罰,顯然不理性。不過,要是博弈只有一輪,基于不信任,大家就都會訴諸短期理性,寧可受到中度懲罰。囚徒困境模型證明時間是重要的因素,即博弈玩一次和玩無限次的結局是不一樣的。如果是無限次,兩人就會合作,因為考慮到博弈的次數n乘上兩人合作的利得,遠大于n乘上兩人不合作的利得,所以兩個人終究會學習合作。囚徒困境模型的目的,是在說明人通過學習,即使基于自利而在短期內做出不利于自己的決定,但長期里最終會回歸最理性的方式,修正自己的行為選擇。[25][26]

          與囚徒困境一樣有名的另一個規范研究的模型是懦夫游戲。在這個模型的情境中,兩人開車迎面撞來,看誰是怕死先閃開的一方就算輸。和囚徒困境最大的不同在于,當雙方都不合作(即不閃開)時,得到的結局對雙方都是最凄慘的;而在囚徒困境中,兩人都不合作時,得到的結果對雙方都只是次凄慘的(即中度懲罰),所以兩囚才都有可能選擇招認。

          表3 懦夫游戲

          注:括號內是兩人的所得,越大的數字表明越大的所得。括號內左邊的數字是主體一的所得,右邊是主體二的所得。在博弈論的建模過程中,每一種決策的效用值究竟有多大,其實并不重要,真正重要的是每一種決策效用相對其他決策效用的大小。例如在剛剛提到的囚徒困境與懦夫游戲這兩個模型中,如果我們改變其中一個模型中效用值的相對大小,我們甚至可以把這個模型轉換成另一個模型。

          (二)博弈論的弱點

          盡管博弈論是規范研究中非常有力的一個工具,但正如任何其他工具一樣,博弈論也有自己的局限性。具體來講,有如下幾點。[27]

          1.博弈論通常假設博弈中的行為主體有相同的期待,即,每個人都知道自己及他人的所有可能的策略,并以此為基礎來決定自己的應對策略。但當相同期待的假設不能被滿足時,博弈該如何進行呢?一個辦法是允許行為主體在不斷博弈中理性的學習:從每輪博弈中,每個主體的期待通過觀察其他人的應對而得到更新,更新后的期待成為下一輪博弈的基礎。

          2.許多博弈論的模型會產生多重均衡點,而無論我們用何種解決辦法,多重均衡的結果都沒法消除。多重均衡意味著博弈的結果并不唯一,如何從多個均衡中選取我們需要的結果呢?博弈論中的“無名氏定理”可以幫助我們更好地理解多重均衡的現象,并給出選取唯一解的理由。

          3.博弈論通常假設相同的知識。字面上的理解自然是行為主體們都掌握同樣多的信息,這意味著除了客觀事實的信息外,主體們還知道其他的主體也知道這些客觀事實,主體們知道所有的主體們都知道所有人都有相同的期待,主體們知道所有人都是理性的,等等。在有限信息博弈論模型中,相同的知識這個假設可以被放松,即一些主體比另一些主體有更多的信息,但信息不對稱這個“信息”卻是行為主體們都知道的。

          4.博弈論通常會假設行為主體是理性的,可另外一個可能的假設是“有限理性”,即在追求特定結果的過程中主體的推演能力是有限的。關于有限理性,文獻中有三類可能的解決辦法。(1)每個行為主體的策略都基于對手所有過往行動出現的頻率,理性是有限的因為主體只需要記住所有的歷史;(2)每個行為主體的策略是基于“有限自動回復”,主體沒法記住所有歷史,他的行動由固定的前幾期的歷史所決定;(3)不同主體從各自的有限知識與分析能力出發得出不同的策略,這些不同策略在同一個平臺下相互競爭、優勝劣汰,最好的策略自然會最終勝出。

          四、規范研究的隱含假設

          在用效用理論或博弈論來建立模型進行規范研究之前,研究者通常需要接受一些隱含的假設。第一,假設參與博弈的主體之間沒有任何情感聯系。這保證了各主體的行為是由純粹利益的計算而決定的,從而使不可觀測的因素不會改變建模者的結論。比如,在囚徒困境中,假如兩個囚徒是父子關系,那么我們對于即使只有一次博弈的結果,也極不可能得到兩人相互背叛的結論。這就是說,模型本身沒有考慮的非直接的利益因素改變了模型的結果。第二,假設主體是利己而非利他的。這與之前提到的主體一致性相呼應,保證了建模者可以相對容易的推演出主體的效用函數。然而,這是對現實的極大簡化,比如,在公車上讓座是我們常見的利他行為,但如果用規范研究的模型來解釋這一點的話,往往會從建模本身的需要出發,把利他行為解釋成為了更好達到自己目標的利己行為。

          五、規范研究的操作框架

          在這些明顯的或隱含的假設的基礎上,我們可以勾勒出一個典型的規范研究的操作框架。

          第一步,研究者應當提出要研究的問題。這是所有研究必須跨出的第一步,但通常也是最為困難的一步。好的開始是成功的一半,好的問題正是好的開始的核心。雖然也有靈光一閃的情形出現,但絕大多數的情況下,提出好的問題要在熟悉本領域文獻,廣泛閱讀其他跨領域的材料,及對社會、政治、經濟、公共政策等眾多領域內規律性的現象保持敏感并不斷思考的基礎上形成的。

          第二步,根據提出的問題以及研究者本身的訓練和偏好,研究者應當決定到底用效用理論還是用博弈論來研究這個問題。如前所述,博弈論的精髓在于研究多主體間互動中的策略。因此,如果我們的研究對象是單一主體如政府,研究目標是這個單一主體應如何在給定的選項間選擇,例如政府應打破還是維持壟斷,那么,這個研究目的決定了純粹的效用理論可能是更適合的方法。所以,應當是研究問題決定了采用何種研究方法,而不是相反。

          第三步,在確定了研究問題和適當的研究方法后,研究者要考慮在自己的模型中要采用哪些假設。因為歸根到底,大部分規范研究的結論在其假設被設定的那一刻起,其實就已經確定了。規范研究的過程是用一套符號邏輯的語言,清晰地告訴讀者怎樣可以從假設推導至結論。這樣,規范研究的每一步都是符合邏輯,并經得起后來研究者的檢驗的,后來的研究者可以很容易地發現模型推演中可能的錯誤。

          最好的假設應當是不言自明的,被絕大多數人和學術界所承認的。但通常僅有這些假設不足以得出研究想要得出的結論,因此,更多的假設不可避免。研究者要使用的新假設應當是較少爭議的。這些假設最好應該有現實的經驗作為依據,并有已有的文獻曾采用過相同或類似的假設。即便如此,研究者還是應當用較大的篇幅來說明自己為什么要用這些假設,及這些假設為什么是合理的。

          表4 規范研究常用的假設

          第四步,自然是推演的過程。這通常是一個模型最顯眼的部分,雖然,對于有經驗的建模者,之前的確定問題(并確立變量)和設立假設,恐怕才是最傷腦筋和凸顯功力的步驟。社會科學規范模型的推演用到最多的數學知識包括代數、微積分和概率論等。

          六、如何評價不同的規范研究的模型

          那么,當一個規范研究的模型被構建出來以后,我們如何把它和另一個規范研究的模型作比較,并評價孰優孰劣呢?像任何社會科學的模型那樣,我們首先的評價指標是這個模型是否能更好的幫助我們理解和解釋我們關心的問題。對于某個問題,好的模型或者能把我們久已認為本該如此的觀念用數理化、邏輯化的語言在一個嚴謹的框架內清晰的表達出來;或者能夠在簡單無爭議的假設的基礎上,推演出反直覺的結論,從而彌補單純靠觀測、歸納的研究方法的不足。比如,斯托爾珀和薩繆爾森在公認的比較優勢理論的基礎上,推導出國際貿易使得一個國家里相對蘊含更豐富的生產要素獲利更多的結論。[28] 這個結論與我們的一般直覺相反。一般的直覺告訴我們,稀缺的東西才能獲取高價,充足供給的東西價格應當下跌才對。

          規范研究的模型還應能自圓其說,也就是說,從假設到結論的推演是按照邏輯一步步進行的,從而保證讀者對于每一步的推演都是信服的。一個好的規范研究的模型還應當對多種情境有普適性。這個模型看似是在某一種很特殊的情境下分析主體的行為,但由于規范研究的特征,只要模型的結構和假設能夠保持,我們完全可以替代入不同的主體,從而用同樣的模型來研究不同的問題。比如,博弈論中的囚徒困境模型,完全可以超越“囚徒”的選擇這個最初的情境,而來分析個人、企業、群體、或國家在類似囚徒困境的結構中是如何用與囚徒類似的邏輯來理性的決策的。事實上,國際關系研究中經常用到囚徒困境模型來分析國家間戰爭與和平的考量。又比如,政治學分析中常見的中間選民理論,最初是被用來解釋為什么美國的選舉候選人有向政黨意識形態偏中間的選民們靠攏的傾向。但隨著這個理論的廣為人知,美國政治以外的學者也開始用中間選民理論來解釋其他領域的熱門問題,如福利國家為什么會發生,或者為什么威權政體可能會轉變為民主政體,等等。

          規范研究與社會科學的其他研究方法一樣,也應當盡量追求簡潔有力。這就是指一個模型應當用盡可能少的變量或假設來解釋盡可能多的變化。如果一個假設不能帶來更大的解釋力,那么這個假設就不應當被包括在模型中。[29]

          七、如何構造規范研究的模型

          作為本文的結尾,我們來探討一下該如何構造一個規范研究的模型。第一種辦法,是自建一個模型。在這里,最重要的原則是簡單、簡單、再簡單。建模從寫下主體們一系列的選擇開始:有什么選擇;該什么順序;選擇時有什么信息;選擇會產生什么后果。然后,考慮主體們對這些后果的可能的偏好。接著,就可以寫下決策樹并算出這個模型的結果了。

          第二種辦法,是修改一個現有的模型,比如改變現有模型的某個假設,或取舍現有模型的某(幾)個變量。從工作量上來說,這通常要比構建一個全新的模型要容易些。但同樣的,我們還是在修改模型的過程中需要簡單、簡單、再簡單。如果普通的方法可以解決問題,就沒有必要用更復雜的方法。

          [參考文獻]

          [References]

          [1][25]石之瑜. 政治科學中形式理論的運用與瓶頸――從賽局理論談起[J].東吳政治學報,2003(17).

          Shih Chih-yu. The Epistemological Limit of Formal Theory in Political Science: Game Theory Revisited. Soochow Journal of Political Science, 2003(17).

          [2][4]顏昌武,牛美麗. 公共行政學中的規范研究[J]. 公共行政評論,2009(1).

          Yan Changwu, Niu Meili. The Normative Research in Public Administration. Journal of Public Administration, 2009(1).

          [3][5]何艷玲. 問題與方法:近十年來中國行政學研究評估(1995―2005)[J].政治學研究, 2007(1).

          He Yanling. Questions and Methods: Evaluation of Chinese Public Administration in the Past 10 years. Cass Journal of Political Science, 2007(1).

          [4][6]劉曉峰,劉祖云. 我國行政學質性和量性研究方法的評價與反思:基于2006-2008年部分期刊文章的樣本分析[J].甘肅行政學院學報, 2010(3).

          Liu Xiaofeng Liu Zuyun. Evaluation and Reflection on the Chinese Public Administration Research Methods. The Journal of Gansu Administration Institut, 2010(3).

          [7]楊立華. 知識困境及其解決方式:以環境治理為例的博弈模型構建[J].中國行政管理,2010(10).

          Yang Lihua. The Knowledge Dilemma and its Resolution Methods: Game Theoretical Models of Environmental Governance. Chinese Public Administration, 2010(10).

          [8]郭慶松. 論勞動關系博弈中的政府角色[J].中國行政管理,2009(7).

          Guo Qingsong. A Study of Government Role on the Game of Labor Relations. Chinese Public Administration, 2009(7).

          [9]Antoine Augustin Cournot,Irving Fisher. Researches into the Mathematical Principles of the Theory of Wealth. Macmillan, 1838.

          [10]Joseph Bertrand. Théorie mathématique de la richesse sociale’. Journal des Savants, 1883:499508.

          [11]Francis Ysidro Edgeworth. La teoria pura del monopolio. Giornale Degli Economisti.1897: 1331.

          [12]John von Neumann, Oskar Morgenstern. Theory of Games and Economic Behavior. Princeton University Press, 1944.

          [13]Anthony Downs. An Economic Theory of Democracy. New York: Harper & Row, 1957.

          [14]Duncan Black. Theory of Committees and Elections. Cambridge: Cambridge University Press, 1958.

          [15]William H. Riker. The Theory of Political Coalitions. New Haven: Yale University Press,1962.

          [16]James Buchanan, Gordon Tullock. The Calculus of Consent. Ann Arbor: University of Michigan Press, 1962.

          [17]Mancur Olson. The Rise and Decline of Nations. New Haven, CT: Yale University Press, 1982.

          [18]William Niskanen. Bureaucracy and Representative Government. Chicago: Aldine, 1971.

          [19]Mancur Olson. The Logic of Collective Action. Cambridge, MA: Harvard University Press, 1968.

          [20][22]William H. Riker. Liberalism Against Populism. San Francisco: W. Freeman, 1983.

          [21]Robert Axelrod. The Evolution of Cooperation. New York: Basic Books, 1984.

          [23]James D. Morrow. Game Theory for Political Scientists. Princeton: Princeton University Press, 1994.

          [24]Rose McDermott. Experimental Methods in Political Science. Annual Review of Political Science, 2002. 5:3161.

          [26]Michael D. Ward, Katherine Stovel, Audrey Sacks. Network Analysis and Political Science. Annual Review of Political Science, 2011. 14:245-64.

          [27]David Kreps. Game Theory and Economic Modelling. New York: Oxford University Press. 1990.

          [28]James E. Alt, Kenneth A. Shepsle. Perspectives on Positive Political Economy. New York: Cambridge University Press, 1990.

          [29]Wolfgang F. Stolper, Paul A. Samuelson. Protection and Real Wages. The Review of Economic Studies, 1941. 9 (1).

          The Methodology of Formal Theory:A Brief Introduction and its Application in Public Administration

          Zhou Qiang

          [Abstract]This article is a brief introduction to the methodology of formal theory, which is common in contemporary research in fields like political science, economics, and public administration. We start from discussions of the basic assumptions of formal theory, namely, internal consistency and rationality, and point out that formal theory research can be conducted using either utility theory or game theory. The choice of a specific approach depends on whether the research in question focuses on the different options facing the decision-maker in his decision making process, or the interactions between multiple players in pursuit of equilibrium. Furthermore, we discuss the implicit assumptions in formal theory, give a typical operational framework for a formal theory research, and enumerate some criteria for judging the quality of a formal theory model. We conclude by listing the ways to construct a formal theory model.

          博弈論在管理學中的應用范文第3篇

          關鍵詞:職業院校 學生管理 博弈

          中圖分類號:G717 文獻標識碼:A

          文章編號:1004-4914(2011)06-147-02

          一、引言

          “博弈論是研究決策主體的行為發生直接相互作用的時候的決策以及這種決策的均衡問題的,又稱為對策論。”近年來,博弈論已被廣泛應用于社會學、經濟學、政治學和文化學等研究領域,并深刻地改變著人們的思想和行為。博弈論不僅是一種理論知識,更是一種解決問題的方法。將博弈論引入教育管理領域,能夠使教育管理問題得到全新的方法論指導。

          目前,職業院校的學生多數文化基礎較薄弱,自我管理能力較差,學生管理工作成了職業院校發展的瓶頸。學生管理是職業院校管理工作的重點,沒有良好的學生管理體系,學校就不可能獲得長足的發展,更無法達到培養人才的目的。因此,面對有著多樣性需求和不同層次的學生,探求如何進行有效管理是必要的,是職業院校學生管理中不可忽視的問題。學校對學生的管理歸根結底是對學生心理活動的管理,因此,要做好學生管理,必須研究學生的心理和行為規律,并以此來制定管理策略,選用管理方法。參與職業院校學生管理活動的各主體的行為是一個動態的、相互影響和制約的博弈過程。本文正是從博弈論的角度對學生管理問題進行探討。

          二、職業院校學生及學生管理工作的特點

          (一)職業院校學生的特點

          職業院校的學生除了具有同齡學生的一般特點外,還具有以下幾方面特點:

          1.文化基礎薄弱,自我學習能力不強。職業院校錄取學生時,分數線大多在300分至400分之間,部分學生甚至低于300分。這樣的中、高考成績從總體上可以反映出這一層次學生的為文化基礎薄弱,學習能力較差。薄弱的文化基礎給他們的入校后的學習帶來一定的困難,容易導致學生喪失學習的主動性和積極性。

          2.人生態度比較目標不明確。職業院校的學生在中學往往屬于“差生”“后進生”,是常被老師和同學看不起的“弱勢群體”。很多學生存在自卑心理。他們的學習態度和人生態度多數比較消極,人生目標不明確。甚至有少數學生由于受到社會不良風氣的影響,形成不良的價值取向。

          3.依賴性強,自我管理能力差。職業院校的學生基本上都是在新時期成長的獨生子女,從小事事由父母操心,逐步養成了對外部管理的依賴,自我管理能力較差。一旦離開父母進入學校,在處理學習、生活等問題時,很多學生會感到茫然,需要得到學校、老師的幫助和鼓勵。

          (二)職業院校學生管理工作的特點

          職業教育是人人成功的教育,不是淘汰選拔的教育,所以職業院校學生的管理必須從生源的基礎素質出發。職業院校要隨時準備接受多樣性的學習者,制定多樣性的入學標準和辦法,設計多樣性的學習內容、學習方式、結業方式,滿足社會多樣化需求。學校在教學方面按適用和就業的標準設計職業技術教育課程體系,按照人人成功的理念設計學生考核和激勵機制,重視的是“合格”而不是“選優”。由于學生是有感彩的人,對學生的管理常常是不可預測的,需要因人而異、因材施教,所以在學生管理上要有多種準備,要有廣泛的適應性。

          三、博弈模型的建立與分析

          (一)博弈的要素

          1.參與人。博弈的主體是職業院校和學生。他們的目的是通過選擇行動或戰略最大化自己的支付水平。

          2.行動。是參與人職業院校和學生在博弈中某時點的決策變量。文章用H1=(努力,不努力)表示可供學生選擇的所有行動的集合,用H2=(獎勵,不獎勵)表示可供學校選擇的所有行動的集合,針對學生努力或不努力的行為,學校可以選擇采取獎勵的手段進行激勵,或者不予任何獎勵。

          3.信息。行動順序和行動空間是職業院校和學生的共同知識。

          4.支付。在學生付出努力的情況下,學校的收益為R:一旦發現學生不努力,就對其實行懲罰F,此時學校的收益只有W。學生努力時付出的成本是C,學校給學生的獎勵是π,且π>C,學校對學生進行監督管理的成本為D。

          (二)模型構造及分析

          本文用不完全信息的混合戰略博弈模型來表述職業院校與學生的行為選擇,對學生管理的相關因素進行分析。

          職業院校選擇模型。假定職業院校以α的概率選擇對學生進行管理,1-α的選擇不管理;職校學生以β的概率選擇努力學習,以1―β的概率選擇不努力學習;學生努力而得到獎勵的概率為V,不努力受罰的概率為θ,博弈模型用圖1表示。

          在上述模型中,U(F)是學生被懲罰的效用損失,U0是學生不努力學習所得效用。職業院校選擇管理與不管理的期望效用分別是:

          E1=β(R-Vπ-θF-W)+θF+W-D

          E2=βR+(1-β)W

          高校行為要達到納什均衡時,必須有E1=E2,即

          β(R-Vπ-θF-W)+θF+W-D=βR+(1-β)W

          可得:

          學生努力的期望效用為E3=αγU(π)-C;學生不努力的期望效用為U0-αVU(F)。學生的行為要達到納什均衡,必須有E3=E4,可得

          α=(C+U0)/[VU(π)+θU](2)

          由(2)式可知:如果學校管理的概率大于(C+U0)/[VU(π)+θU],學生就選擇努力學習;如果學校管理的概率小于(C+U0)/[VU(π)+θU],學生就選擇不努力學習;當學生管理的概率等于(C+U0)/[VU(π)+θU],學生隨機選擇努力或不努力學習。

          四、結論與啟示

          1.職業院校學生的行為選擇是管理制度的函數。學校的管理制度約束了學生行為的選擇集,學生在不同的制度環境中將選擇不同的行為方式。如在上述的職業院校與學生的博弈模型中,對選擇努力學習的學生給予獎勵,促使其自覺地強化和保持努力行為;對選擇不努力學習的學生給予懲罰,促使其自覺地抑制和取消不努力行為,則學生選擇努力行為的概率增大。同時,由于懲罰所得變為學校的監督收益,使學校監督成本下降,監督概率增大,學生不努力行為被查處的可能性增大,不認真學習等行為相應減少,學生選擇的努力行為的可能性進一步增大。因此,學生的行為選擇是管理制度的函數,科學、合理的管理制度的設置將有效地規范職業院校學生的行為。

          2.處罰力度是參與人行為的函數。職業院校對學生的處罰力度要根據學校的監督概率的大小和學生服從不服從管理,做相應的減弱或加強。但處罰不能太小,否則可能起不到應有的教育效果。

          3.職業院校在學生管理中應科學地運用激勵措施。學校管理歸根到底是對學生心理活動的管理,也就是說要做好學生管理工作,必須研究學生的心理和行為規律,并以此來選用管理方法,制定管理制度。職業院校招收的學生文化成績偏低,學生自卑情緒嚴重,自控能力不強,違紀犯錯現象比較常見。但是,職校學生的追求和向往并不比其他學生差,他們需要得到更多的理解、關愛和幫助。職校學生的以上特點要求在教育管理實踐中,學校和老師必須弄清楚學生的各類需要,采用相應的激勵措施調動學生的積極性。

          管理學中激勵理論的借鑒與運用,為職業院校的學生管理工作提供了新的工作思路,可以克服傳統學生管理工作的過度剛性,克服管理方法的公式化和簡單化,由于激勵理論具有平等性、啟發性、情感的感染性等特點,強調人性化教育和柔性管理,注重個性和情感因素的充分發揮,因此符合當代職校生的思想、心理和行為特點,必將成為職業院校學生管理工作順利開展的有效手段。學校通過運用有效的激勵措施,可以最大限度地調動學生的積極性和能動性,使之以最大的熱情投入到學習和工作中,充分發揮職校生的最大潛能,從而更好地實現教育管理目標。

          此外,職業院校在制定獎學金和其他獎勵措施時,應針對后進學生設立一些獎項,使得他們有可能實現目標,這樣的措施對后進生才具有激勵作用。職業院校重視的是“合格”,而不是“選優”,所以,學校應該改變現有單一的評估體系及考評措施,設立諸如“進步獎”等獎項,激發后進生的積極性,使得他們能夠獲得成就感和滿足感。

          4.強化學生管理,形成嚴格的校風、學風。對學校而言,形成良好的風氣很重要,對學生而言,形成良好的習慣很重要。尤其對自我管理能力較弱的職校學生。學校加強管理,能促使學生走向自覺,學校放松管理,學生容易松懈。所以,職業院校應該在學生管理方面加大力度,切實強化學生管理,以樹立嚴格的學風、校風。這樣雖然會增加學校的投入,加重老師的負擔,但是會對學生的行為產生積極的影響,并有助于學生逐步養成良好的學習和生活習慣。

          五、結語

          學生管理工作一直都是職業院校各項工作的重中之重。隨著人才觀、教育目的觀轉變,勢必要求職業學院改革以往的學生管理制度,創造新的管理制度。因此,職業院校應將學校管理制度的建設與創新作為頭等大事來抓。學校在學生管理了工作中要科學合理地運用激勵措施、懲罰措施,創建良好的校風與學風,促使每個學生循著正確的方向努力。

          參考文獻:

          1.張維迎.博弈論與信息經濟學.上海人民出版社,1996

          2.付宜新,王玉.淺談高等職業院校學生管理中的分層管理.太原城市職業技術學院學報,2006

          3.余佳華,王庭.激勵理論在高校學生教育管理中的應用.皖西學院學報,2007(1)

          (作者單位:山西電力職業技術學院 山西太原 030021)

          博弈論在管理學中的應用范文第4篇

          關鍵詞:學術權力 行政權力 協調博弈

          歷經千年風雨洗禮的大學盡管面臨著危機和挑戰、質疑和指責,仍然在培養人才、發展科學、社會服務中發揮著不可替代的社會職能。隨著大學的發展,大學內部治理結構,尤其是學術權力與行政權力的關系問題受到普遍的關注,關注的焦點從二者的沖突發展到二者的協調,非此即彼的誤區產生了諸多的疑問和困惑。在學術權力與行政權力之間,權力如何界定?利益如何分配?價值如何追求?規則如何制定?學術權力與行政權力的糾纏不清,致使大學在實際運行中,存在著值得深入反思的現象:諸如,學術會議中,絞盡腦汁的桌牌擺放次序;介紹詞中,行政職務和代表學術造詣的職稱稱謂并存;更有甚者,用行政手段直接干涉學術事務的現象,比比皆是。行政權力凌駕于學術權力之上的事實,嚴重地削弱了大學教育性和學術性的內在屬性,大學的核心價值追求受到嚴峻的挑戰。上述現象反映的是大學內部主要權力即學術權力與行政權力的關系問題。無怪乎,阿什比發出這樣的慨嘆,“大學的興旺與否取決于其內部由誰控制”。[1]

          大學內部學術權力與行政權力的關系問題決定著大學的發展,將協調博弈理論應用到高等教育領域,強調的是協調博弈理論在解析二者關系上的工具價值。協調博弈存在著多重納什均衡,其“強調參與者行為信念選擇的一致性”,[2]即參與者既得利益不僅依賴自身行為策略的選擇,同時依賴對方行為策略的選擇,因此雙方的行為信念,以及對于信念的預期在行為選擇時尤其重要。學術權力與行政權力能否協調意向均衡?二者是否具有統一的行為規范?能否確立相互信任的信念?協調的結果對利益的分配會帶來怎樣的變化?從某種意義上講,以協調博弈理論重新審視學術權力與行政權力的關系,構建學術權力與行政權力的協調博弈模型,分析學術權力與行政權力選擇的策略情境及其利益主體之間的均衡,從而揭示大學內部權力運行機制,必將有助于完善大學的內部治理結構,推進大學的長遠發展。

          一、學術權力與行政權力

          (一)學術權力、行政權力綜述

          國外關于學術權力和行政權力的經典研究當屬加拿大學者約翰?范德格拉夫等編著的《學術權力――七國高等教育管理體制比較》以及美國學者伯頓?克拉克所著的《高等教育系統――學術組織的跨國研究》。約翰?范德格拉夫運用組織社會學、比較政治學和公共管理學比較聯邦德國、意大利、法國、瑞典、英國、美國和日本七國高等教育制度的權力結構。運用結構的等級性和決策的內聚性分析權力結構的特征,進一步研究系列講座、學部、大學、聯合大學、州政府、中央政府六級組織層次以及總規劃與決策、預算與財政、招生辦法與入學機會、課程與考試、高級與初級教學人員的聘任、研究的決策模式六大政策領域。

          伯頓?克拉克從組織的觀點闡明高等教育系統的基本要素:工作、信念、權力。克拉克認為“各種不同的群體有著自己特定的利益和信念,甚至有自身的神話和游戲規則”, [3]因此群體、信念、利益、規則構成了法定權力模式。高等教育系統的學術權力形式表現為:扎根于學科的權力、院校權力以及系統權力。扎根于學科的權力具體表現為個人統治、學院式統治、行會權力、專業權力;院校權力具體表現為董事權力、官僚權力;系統權力具體表現為政府權力、政治權力、全系統學術權威人士權力,各種形式的權力在高等教育系統中構成了錯綜復雜的權力網絡全景圖。在分析各國權力分配的模式時,克拉克抓住了權力結合模式的基本特征,即學術權力和行政權力在大學中是如何分配的,誰在大學中占統治地位,概括出四種權力結合模式:大陸型模式、英國模式、美國模式以及日本模式。

          克拉克從廣義的范疇對學術權力加以理解,在他看來,學術權力即高等教育管理中各個層次的管理機構和人員所享有的權利。因此,王世權、劉桂秋認為:西方學者關于大學學術權力和行政權力的模糊界定,取決于二者關系的定位,行政權力是大學發展過程中由學術權力衍生的,行政權力服務并服從于學術權力,行政權力的服從與服務性質,使得權力的運行秉承“大學術、小行政”的理念,符合學術權力與行政權力的價值邏輯。[4]

          國內關于學術權力與行政權力的研究最早始于二十世紀九十年代,并逐年上升成為熱點研究問題。相比國外研究,國內研究則以學術權力和行政權力的概念為起點,注重基礎理論研究,從不同視角闡釋學術權力和行政權力。目前,學者關于學術權力的典型界定大致分為三種:界定強調學術權力主體,將學術權力理解為學術人員和學術組織所擁有和控制的權力;界定強調學術和學科能力,將學術權力理解為學術權威,即真正的學術權力是學術權威的學術地位和學術成就及影響形成的學術魅力;界定強調學術權力客體,將學術權力理解為管理學術事務的權力。廈門大學別敦榮教授,認為“就學理而言:學術權力指管理學術事務的權力。其主體,即權力的掌握者或行使者,可以是教師民主管理機構或教師;也可以是學校行政管理機構或行政管理人員。還可以是政府及高等教育管理部門等。客體,即權力的作用對象,必定是學術事務。作用方式,可以是行政命令式的,也可以是民主協商式的。”[5]

          學者關于行政權力的典型界定大致分為以下三種:依據行政權力的行為主體,認為行政權力是指行政人員和行政機構所擁有的保障大學理想實現的權力;依據制度的賦予,認為行政權力的大小取決于行政組織在整個管理系統中的位置和層次,行政權力產生于正式的組織和制度,并依賴組織的任命;依據行政管理職能,以行政管理體制作為基礎的法定權力,認為行政權力是行政組織機構和行政人員所行使的權利。

          縱觀國內學者關于大學學術權力和行政權力的概念界定,背后折射的是中國語境下學術權力和行政權力的關系,行政權力的強勢和泛化,導致學術權力成為行政權力的附庸,喪失了決策學術事務的獨立話語權,行政權力取代學術權力的現象反映的是“大行政、小學術”的價值邏輯。[6]

          (二)學術權力、行政權力的邏輯起點

          阿什比在論及大學的理想時指出,大學是遺傳與環境的產物。時至今日,大學的發展依舊秉承兩條脈絡:大學自身內部發展的邏輯;作為社會環境子系統發展的需要。具有現代意義的大學自誕生之日起,就是“控制高深知識和方法的社會機構”, [7]大學加工的基本材料高深知識不同于其他社會組織,“這些知識有著內在的邏輯性和內在的自主性傾向”。 [8]根據知識材料隨之而來的是學科和專業的分化,教授是專業和學科領域中從事教學和研究的專家、學者,他們的工作與學科和專業的發展密不可分,是學術事務、學術活動中最有資格、最具權威的人。學術權力是大學維系其存在和發展的內在邏輯的要求,保證了學術組織、學術人員、學術專業服從于真理的標準,而不受外界諸如國家、政府、市場的利益所驅使,避免了大學因迷戀政治權力、行政權力、自由市場而淪為權力、金錢、市場的附庸。

          自由與自治體現了學術權力的價值取向,但是缺乏約束的權力會盲目膨脹,致使學術陷于門戶和宗派之爭。同時,隨著大學組織內、外部環境的不斷變化,大學日益繁雜的行政事務需要具有“效率為先”價值取向的行政機構行使行政權力進行管理與決策。行政機構和行政權力的出現恰恰體現了大學作為社會環境子系統的特性。但是,現實的發展卻超乎了人們臆想的局面,行政權力不僅以其絕對的優勢管理和決策行政事務,還以其擁有的權力干預學術事務。行政權力超越了既定的權限,甚至與大學成長的內在邏輯產生沖突,自由與自治精神漸行漸遠,違背了大學精神與科學理想的初衷。由此可見,“任何權力都有局限性,權力的無度和濫用必然導致權力的異化,導致失誤和混亂。”[9]基于此,大學內部學術權力和行政權力以其特有的信念與規則,代表著各自不同的利益,配置資源、調控信息、選取策略,形成了完整的協調博弈主體。

          二、構建學術權力與行政權力的協調博弈模型

          建構合理、高效的大學內部權力利益協調、資源分配及補償機制,尋求行為信念選擇一致的多重均衡點是大學內部權力協調博弈模型構建的關鍵。納什對于多人博弈中的均衡點理解為:在其他博弈參與者策略不變的情況下,每個參與者的混合策略都將最大化自身利益。通俗地講,在博弈中至少存在著這樣的策略組合,參與者任何一方如果要改變策略,都將會獲得更差的結果。因此,薩繆爾?鮑爾斯認為,納什均衡“是一種在其他人的狀態給定的條件下,每個人都盡其所能,做到最好。”[10]“均衡表明事物處于平衡和穩定狀態。而穩定性恰恰是了解很多自然過程的核心概念。生物系統、化學和物理系統,甚至社會系統,無不在尋求穩態。”[11]大學的內部權力正是在均衡、打破均衡、尋求進一步均衡的過程中持續存在和發展的。確定學術權力和行政權力如何在學術事務和行政事務的決策、執行中達到均衡可以預判大學的發展趨勢,以至影響大學的興旺發達。

          以交通博弈為例,支付矩陣如表1。

          路人甲、路人乙相向而行,假設甲乙二人同時左行或者同時右行,那么甲乙二人各行其道,保證了通行秩序,各獲得3個單位支付;假設甲乙二人一個選擇左行,另一個選擇右行,行進中可能相碰,各獲得0個單位支付。該矩陣中存在:同時左行、同時右行的兩個純策略納什均衡以及左行和右行各占50%的混合策略納什均衡。在協調博弈中,參與者雙方只要就策略的選取進行協調,不論是選擇左行的策略A或是選擇右行的策略B,協調的結果總是最佳的。

          在大學內部權力的協調博弈中,如果學術權力與行政權力參與者均相信某個特定的均衡,同時相信對方也相信這個特定的均衡,那么這個特定的均衡發生;反之,如果信念不同,對另一方的信念的信念預期也不同,博弈的結果則會出現偏差。可見,學術權力與行政權力策略選擇一致的情況下,可以獲得最大利益,即最大利益來自于雙方的協調而不是沖突。例如在資源有限的前提下,以學科建設為例,權力主體就優勢學科和一般學科建設進行決策,他們的選擇是:加強優勢學科建設或者扶持一般學科建設。假設優勢學科建設與一般學科對于大學的發展各帶來10單位的支付,那么支付矩陣如表2。

          在該矩陣中同樣存在優勢學科、優勢學科,一般學科、一般學科的兩個純策略納什均衡,以及優勢學科和一般學科各占50%的混合策略納什均衡。如果雙方均選擇加強優勢學科建設或扶持一般學科建設,對于大學相應的學科發展尤為有利。當然也可能會出現一方支持優勢學科建設,一方支持一般學科建設的情況,導致無果而終。當利益雙方發生沖突時,權力主體只要就優勢學科建設還是一般學科建設進行協調,相信選擇優勢學科建設與一般學科建設的最佳策略更容易形成納什均衡,但不論是加強優勢學科還是扶持一般學科,協調的結果對于大學的發展都是有利的。

          大學事務中存在著廣泛的類似的協調博弈。在有限的學術資源配置過程中,如果利益雙方存在沖突,就要設法進行協調。協調過程中,參與雙方就利益群體不同的信念、規則而做出相應的行為選擇,協調成功或者失敗依賴具體的博弈環境。在學術權力和行政權力處理大學事務時,構建協調博弈模型如表3。

          在該矩陣中可以清晰地看到學術權力和行政權力的協調博弈。盡管存在策略A、策略A,策略B、策略B的兩個純策略納什均衡,以及策略A和策略B各占50%的混合策略納什均衡,但是通過協調,學術權力與行政權力確立相同的行為選擇信念,協調的結果是同時選擇策略A或策略B的最佳方案,策略的一致使雙方獲得最大利益,最終有利于大學事務的決策與執行。

          三、構建學術權力與行政權力協調博弈模型的條件

          (一)協調與信念

          大學興旺發達符合大學發展的長遠利益,構建學術權力與行政權力的協調博弈模型,信念是形成特定均衡的重要條件。行為信念選擇一致才能達成均衡,或者理解為為了達成均衡,權力雙方彼此要求對對方的信念形成信念。在上述學術權力和行政權力處理決策事務的協調博弈中,學術權力可能選擇策略A、可能選擇策略B,同理行政權力亦然,這樣就形成了復雜的局面,而解決復雜局面的關鍵即形成這樣的信念:學術權力和行政權力博弈雙方均相信策略A或策略B有利于大學的發展,同時相信對方也同時選取策略A或策略B。信念相同,同時對另一方信念的預期亦相同,才能獲得最大的利益收益。

          在囚徒困境博弈和獵鹿博弈中,博弈雙方都在追求利益的最大化,但結果卻出人意料,為什么會出現雙方視最大利益不顧,而選取了另外的策略呢?實際的情況是缺乏溝通、協調。協調是形成一致的行為信念的關鍵。在學術權力和行政權力協調博弈模型中,如果沒有協調,學術權力和行政權力選擇策略A或策略B時,考慮的是自身利益,利益與參與者的直接關聯可能導致博弈的危機。而通過協調促使雙方行為信念趨于一致,最終會形成合作的博弈結果。

          (二)合作與忠誠

          大學的學術權力與行政權力各有其存在與發展的邏輯基礎,而雙方的合作有利于大學的長遠發展,通過協調獲得的雙方的行為信念的一致性,已經為合作創造了條件。同時,在協調共存體系中,學術權力和行政權力的博弈重復進行,博弈雙方不得不考慮此次行為策略的選擇是否會影響下一階段博弈的結果。換句話說,重復博弈的存在使得博弈雙方不得不考慮雙方的長期利益,而不是一次性的即時利益。因此,采取合作而不是對抗,必要時舍棄短期利益,恰恰體現了雙方的長期利益,即合作則雙贏。

          合作引發了學術權力和行政權力的重新審視:學術權力和行政權力在群體、信念、利益、規則方面存在著很大的差異性,但基于大學理想,學術權力和行政權力博弈雙方有必要也可能打造有利于大學發展的忠誠文化。根據上述學術權力與行政權力的協調博弈模型的分析,博弈雙方追求自身即時利益造成危機的可能性是存在的,通過協調形成行為信念一致的出發點,是大學發展的長期利益。可見,學術權力和行政權力在博弈過程中,忠誠大學理想的文化是最終形成選取純策略A或策略B的有效法則。

          綜上所述,大學內部學術權力與行政權力各有其存在和發展的必要性和必然性,事實證明,試圖抵制任何一方在大學中的發展都是不可取的。因此,在學術權力與行政權力共存的體制下,大學內部學術權力與行政權力協調博弈模型的構建,必將有助于理清學術權力與行政權力的關系,完善大學內部的治理結構。通過博弈雙方即學術權力與行政權力的協調與合作,確立行為信念選擇的一致性,打造忠誠于大學理想的文化,最終服務于大學的長遠發展。

          參考文獻:

          [1][3][7][8]伯頓?R?克拉克.高等教育系統――學術組織的跨國研究 [M].王承緒,徐輝,殷企平,蔣恒,譯.杭州:杭州大學出版社,1994.4:17,120,11,16.

          [2] 小約瑟夫?哈林頓.哈林頓博弈論[M].韓玲,李強,譯.北京:中國人民大學出版社,2012.2:58.

          [4][6]王世權,劉桂秋. 大學治理中的行政權力:價值邏輯、中國語境與治理邊界[J].清華大學教育研究,2012,(4):100-106

          [5] 別敦榮.學術管理、學術權力等概念釋義[J].清華大學教育研究,2000(2):47.

          [9] 潘懋元.多學科觀點的高等教育研究[M].上海:上海教育出版社,2001.9:295.

          博弈論在管理學中的應用范文第5篇

          關 鍵 詞:博弈論;信息經濟學;行為經濟學;激勵理論

          中圖分類號:F069.9

          文獻標識碼:A

          文章編號:1005-0892(2007)03-0005-07

          一、現有委托―理論的不足

          委托―關系廣泛出現于各種經濟管理問題中。大到國家對其下屬各類機構的管理,中到行業管理機構與企業的關系,小到企業內部董事會與經理層,甚至工廠班組領導與其所管理的工人們,委托―關系幾乎是無處不在,無時不有的。現有的委托―理論模型主要是來自信息經濟學的直接應用,是博弈論在不對稱信息情形的應用。該模型的主要思想是,委托―關系中存在的主要問題是委托―合約簽定之后可能會出現事后的信息不對稱,即道德風險,從而損害對方的利益。人的道德風險會損害委托人的利益,而委托人的道德風險也會損害人的利益。現有的委托―模型更多地是對存在人道德風險情況下的激勵機制進行研究(張維迎,1996;Holmstrom,B,1979; Mirrlees,J,1975,1976)。[1-4]當然,對于存在委托人道德風險情況下的激勵機制也有相關的研究(張維迎,1996)。[1]在委托人不能無成本地觀察到人行為的情況下,委托人通過與人簽定合約,約定按照某些雙方都可觀察到的指標體系來向人支付報酬(或進行獎懲)的辦法對人激勵。在這種模型中,委托人的支付函數是期望效用函數,委托人不能直接無成本地觀察到人的行為或努力水平,而是通過激勵相容約束條件對人的行為或努力水平進行間接判斷。委托人給予人的報酬一般分為兩部分,一部分是固定報酬(如固定工資或基本工資),另一部分是與業績掛鉤的變動報酬(或變動工資)。業績一般用雙方都可觀察到的指標(如利潤等)來衡量。在現有的主流模型中,最優激勵機制或合約要求參與約束條件給予人的期望支付(或期望效用)恰好等于人的保留支付(或保留效用),或者人得到的期望支付比其保留支付最多多出一點點兒。這是委托人理性假定的必然結果。委托―模型近年來在已故的法國圖盧茲學派領頭人拉豐(JJ Laffont)的推動下有了新的發展。[5]

          現有的委托―理論模型存在這樣一個問題:人的行為只對其所獲得的絕對收入水平作出反應,沒有考慮人會關注其他人的收入水平,或者說,只是假定人的效用僅僅取決于其個人絕對收入水平,沒有考慮相對收入對人效用的影響。盡管現有的委托―模型也考慮了人的相對業績對委托人設計最優合約的影響(即所謂的“標尺競爭”機制),但是,人行為反應居然未考慮其相對收入,這不能不說是研究上的一個嚴重缺失。同時,人在現有的委托―模型里沒有出現對“公平”的追求,這也是與許多事實相左的。委托人在給人支付報酬時,如果人不止一個,就會出現人對委托人進行的利益分配是否公平予以關注,而這種關注一般會影響人的行為反應或努力程度。一般來說,收入效應又是與公平效應相聯系的。我們可從現實中觀察到的現象來說明這一問題。

          在現實中,我們可觀察到許多與現有的委托―模型相矛盾的現象。譬如,一些公司給它們的職員(特別是白領職員)以明顯高于其保留工資的固定工資,這可理解為公司給予這些職員的期望收入是遠高于他們在其他地方工作所得到的保留收入。這些公司本來完全可給予其職員較低些的固定工資也不會影響其職員的積極性,因為這些固定工資只要能夠滿足參與約束條件即可,而把這些固定工資降低一些后,參與約束也仍然是滿足的。影響職員工作積極性的是變動工資部分的收入。所以,如果假定公司所有者是理性的,現有的委托―模型就不能解釋這些現象。筆者最近作了一項實證研究,搜集了10個行業的公司白領職員人均年收入數據,每個行業搜集了50個公司的數據。通過統計分析,將這些數據分解為人均固定收入和人均變動收入兩部分,又通過計量經濟模型分析發現,每個行業里不同公司的人均固定收入都是不同的,而相同行業中不同企業職員的保留收入卻是基本相同的。所以,這項研究否定了現有的委托―模型所作出的預言。

          由于每個樣本序列中人均固定收入最低的公司的人均固定收入是不小于其保留收入的,因此,所有那些人均固定收入大于人均固定收入最低的公司的樣本公司的人均固定收入都是大于行業保留收入的。可見,這些公司白領職員的期望收入是嚴格大于行業保留收入的,這項實證研究否定了現有的委托―模型。

          筆者在研究中發現,通過在現有的委托―理論模型中引入對“公平”的考慮,不僅可完善現有的委托―理論模型,而且還能夠對上述研究結果加以解釋。近年來,許多研究者對傳統經濟學關于理性人的假定提出異議,認為至少不是所有人的行為都能用新古典經濟學的效用最大化來加以解釋,而利他行為,即人們之間的相互幫助現象是普遍存在的。所以,近年來行為經濟學也針對理性人假設進行了修正,試圖對許多傳統經濟管理理論不能解釋的現象予以解釋。一項引人注目的原創性研究是Rabin(1993)的思路,他在J.Geanakoplos,D.Pearce和E.Stacchetti(文獻中簡稱為GPS)所提出的“心理博弈”框架基礎上,構造了一個引入公平偏好的博弈論體系。通過對“公平”概念加以嚴密的定義,他改造了傳統博弈論中的支付函數,從而發現了一些新的均衡。即除了傳統博弈論中已知道的納什均衡外,還出現了一些新的“公平均衡”――“合作性均衡”,這些新的均衡并不象傳統博弈論那樣要求無限次重復博弈或信息不對稱條件。這種結果對利他行為和合作現象的解釋是強有力的。

          Rabin(1993)的一個有價值的貢獻是把“公平性”(fairness)定義為“當別人對你友善時你也對別人友善,當別人對你不善時你也對別人不善(即‘投桃報李’和‘以牙還牙’)”,而且他的獨特貢獻是對這種概念給予明確的規定,即“如果你在損失自己效用(收入,利益等)情況下去損害別人的效用(收入,利益等),就被定義為你對別人不善;如果你在損失自己效用(收入,利益等)情況下去增進別人的效用(收入,利益等),就被定義為你對別人友善。”心理學的諸多實驗證據表明,人的行為在許多情形下是遵循這種定義的“公平性”規則,特別是在按照這種規則作出反應時所造成的潛在物質利益損失不太大的情況下更是如此。本文認為,按照Rabin的方法,不僅可解釋為什么一些公司給予其職員的期望收入明顯高于其保留收入,而且還能夠解釋上面提到的那項近期實證研究結果。公司在給予其職員明顯高于其保留收入情況下是損失公司自己的收入或利益,因而表現出對其職員的友善行為;基于“公平性”規則的考慮,職員們在這種情況下對公司也表現出友善,這種友善行為表現為即使在沒有公司管理人員監督的情況下,也不會有偷懶或小偷小摸等損害公司利益的行為。這樣,公司給予其職員高于其保留收入的期望收入盡管減少了公司的利潤,但是由于職員們的“投桃報李”,公司可以通過減少監督而在監督費用上有節省。當節省的監督費用大于因為公司給予其職員高于其保留收入的期望收入而減少的公司利潤時,公司的總利潤水平卻是增加的。可見,這些公司的行為仍然是理性的,因為其行為仍是追求利潤最大化。

          運用Rabin的分析框架,我們對企業的多樣化行為就有了更深刻的認識,即企業可以將“公平”作為新的要素加以運用,以增加其利潤。由于不同公司的職員表現出不同程度的“公平性”行為,因此,在將“公平”作為新的要素加以運用來增加公司利潤時,不同公司給予其職員的固定收入一般是不同的,這也是我們在實證研究中發現每個行業里不同公司的人均固定收入都是不同的原因。當然,根據現有的效率工資理論,也可對公司為何給予其職員高于其保留收入現象作出解釋,但這要求博弈是無限次重復的,而按照“公平博弈”的思路并不需要作出這樣的假定。從這樣的思路出發,我們可以將基于Rabin的公平性植入現有的委托―理論模型中,從而在保持現有的理性人假定下(即追求利潤最大化假定),將現實中的公平偏好納入最優機制或合約的設計里,完成對現有委托―理論模型的改造,并獲得同時考慮了理性人假定和公平性的一個新的委托―理論模型。這項研究的理論意義在于將行為經濟學中有價值的要素與現有委托―理論模型相結合,從而完成對現有委托―理論模型的修正和改造。該研究的實際意義是使委托―理論的適用面更加廣泛。按照這種理論模型所設計的最優激勵合約也更加有效率,為企業帶來更大的利潤。此外,它還具有更加廣泛的意義,因為我們所看到的不同企業在企業文化上的差異也許正是它們的管理層和職員在公平偏好上的差異造成的,而得到的預期理論模型還可為我們在組織行為學和人力資源管理學(如雇傭決策和薪酬設計等)的研究中產生較大的影響,甚至可能對現有的組織行為學和人力資源管理學帶來創新性研究。

          二、引入“公平博弈”的委托―模型

          本文目的是在現有的委托―模型中引入“公平”要素,并在“公平”概念的界定上采用Rabin(1993)的理論,即“互惠性”理論。“互惠性”理論是屬于行為經濟學范疇,因而本文工作的實質是在傳統激勵理論中引入行為經濟學的假定。我們假定人具有Rabin(1993)所說的“互惠性”行為。[6-10]對于委托人,這里仍假定其是傳統的理性人,這在委托人是公司或政府等非自然人的場合是恰當的。這種假定可使我們去考慮這樣的問題,即委托人如何利用人的非理去設計工資制度,使委托人獲得最大利潤,甚至比在現有委托―理論中(其中假定人是理性人)所獲得的最大利潤還要大的利潤。

          在具體的模型構造中,一個問題是如何在模型中刻畫委托人與人之間的“互惠性”。這個問題在Rabin(1993)[6]中沒有給出具體答案(盡管其中給出了抽象的效用函數)。因此,不同的刻畫方法會得出不同的對現有委托―理論的修正結果。本文將給出一種具體的刻畫方法,結果證明現有的Holmstrom―Milgrom模型中的最優合約不是帕累托最優的。

          假定委托人知道人是非理性的,且在行為上表現出這樣一種“互惠性”――當委托人在犧牲自己利益的情況下給予人更多的利益時,人會以情愿犧牲自己的利益來回報委托人的好意。具體來說,假定委托人給予人的固定收入要比現有委托―理論中恰好使人獲得等于其保留支付的固定收入要高一些。這樣,委托人以犧牲一個等于這個高出保留支付數量的利潤給予人,使其以同樣數量的收入增加。人的“投桃報李”行為假定他們會在現有最優努力程度上再增加一定數量的額外努力,從而使自己不能獲得最大效用,但可以增加委托人的利潤,使委托人的利潤比在人選擇傳統委托―理論中的最優努力程度時所獲得的利潤還要多。人選擇了以犧牲自己的效用為代價的方式去增加委托人的利潤。我們將證明,在一定的條件下(這些條件對委托人和人各自犧牲自己利益的程度作出限制),人的非理的確使委托人得到的利潤比人表現出理時還要高,即使委托人這時付出了比現有委托―模型中的固定收入還要高的固定收入之代價。

          下面先給出現有的Holmstrom―Mirrlees委托―理論的一種簡化模型,由Holmstrom與Milgrom(1987)給出,[6]它是一個適當簡化的一維連續變量一般化模型,用參數化方法表述。該模型在文獻中被大量采用。設a為人程度的一維變量,生產函數為π=a+θ,π是產出或利潤,θ是均值為零、方差為б2的正態分布隨機變量,是外生不確定因素。故有

          其中E表示數學期望算子,Var表示方差。

          假定委托人是風險中性的,人是風險規避的。

          現在考慮線性合約,即當委托人和人的絕對風險規避度都為常數時,理性人情形下的最優合約是線性的,這里假定不變的絕對風險規避度(見張維迎,1996):

          這樣,我們就完成了傳統委托―模型的行為經濟學改造。這說明在一定條件下,企業對其職員更加人性化的關懷,給予員工比其保留支付還要多的固定收入,不僅不會減少企業的利潤(本文中支付,效用,利潤和收入等概念是在可互換意義上使用的),而且正好相反,企業因此而激發起員工的感激之情,使員工更加努力地為企業工作。這個模型可以解釋許多成功企業的人性化管理和相應的企業文化,可以解釋如日本企業員工在下班后仍然在為企業無償工作等現象,也可解釋大公司給予其高管高年薪收入的現象。在日本的許多企業里,公司給予員工非常好的福利,公司高層也經常在業余時間里與員工們進行平等友好的交流溝通;反過來,員工的回報是在公司處于困境時也不象歐美企業中的員工那樣頻頻跳槽,而是寧愿接受減薪在原來的公司里繼續努力工作,與公司共渡難關。這種現象在韓國企業中也能看到。這都是通過上述這個模型可以得到解釋的。

          根據式(2),當δ>0,у>0時,基于人的這種非理性“互惠性”行為的工資合約給委托人和人都帶來比Holmstrom―Milgrom合約更高的支付,所以,新合約帶來的是一種帕累托改善。這種帕累托改善在理性人的Holmstrom―Milgrom框架里是無法實現的。這也說明,Holmstrom―Milgrom模型中的最優合約不是帕累托最優的。筆者猜想,包括文化在內的一些潛制度如習俗、宗教等,都可能有將這些僅靠理性合約不能實現的帕雷托最優加以實現的功能,這種猜想還有待于進一步加以驗證或者證偽。

          三、考慮人的“互惠性”是委托人“善意程度”的函數的情形

          將δ理解為委托人對人的“善意程度”,人在委托人給予其較大的“善意程度”的情況下,理應以較大的“善意程度”回報,這是人之常情。所以,我們自然地假定у是δ的函數。當δ愈大時,у就應愈小,所以有у=у(δ),у′(δ)

          委托人在式(3)中選擇δ使Ev*最大化。一階條件為:

          其實,在理論上存在著許多可想象出來的刻畫人的“互惠性”非理的方式,這些不同方式所形成的合約性質是下一步工作要研究的問題。

          本文所進行的是原創性工作,通過引入行為經濟學方面的理念,并在將這種理念加以具體刻畫的基礎上,改造了經典委托―理論中的Holmstrom―Milgrom模型,使之能夠在人的行為動機上包含“互惠性”非理在內的比單純的理性人假定更加豐富的內容,而現有的理性人假定下的委托―理論(即Holmstrom―Milgrom模型)只是我們發現的模型之特例。譬如,在我們得到的模型里,令人是理性的,則給定委托人的任何δ,人選擇的努力程度都是最大化式(2)的左端。容易驗證,此時由新模型給出的最優合約就正好是Holmstrom―Milgrom模型。

          需要指出,無限次對稱信息重復博弈中的無名氏定理以及有限次重復不對稱信息中的聲譽模型,都不能解釋諸如日本企業中的公司與員工間的互惠,因為它們實際上要求人的行為是委托人可以觀察到的,這是這些模型的潛在假定。但是,在委托―關系中,人的行為被假定是不能被委托人所觀察到的。

          由于Holmstrom―Milgrom模型是現有激勵理論和整個信息經濟學的最基本的模型,激勵理論和信息經濟學是從這個模型框架發展而來的,所以在本論文中所做的工作具有開創性的意義。因為,通過這種行為經濟學理念的植入,可以完成對整個信息經濟學和激勵理論體系的改造。這種改造是需要的,從本文中已發現,至少對于經典的Holmstrom―Milgrom模型來說,其最優激勵合約是非帕累托最優的。即是說,從本文所得到的模型出發,可以開展對現有信息經濟學和激勵理論基本框架的重建。這將是未來的一個系統且漫長,但又是激動人心的系列工作。

          ――――――――

          參考文獻:

          [1]張維迎. 博弈論與信息經濟學[M]. 上海:上海三聯書店,1996.

          [2]Holmstrom,B. Moral Hazard and Observability[J]. Bll Journal of Economics,1979,(10):74-91.

          [3]Mirrlees,J. The Theory of Moral Hazard and Unobservable Behavior: Part I[R]. Nuffield College,Oxfordd,1975.

          [4]Mirrlees,J. The Optimal Structure of Authority and Incentives Within an Organization[J]. Bll Journal of Economics,1976,(7):105-31.

          [5]JJ 拉豐,D 馬赫蒂摩. 激勵理論:委托-理論(第一卷)[M]. 陳志俊,等譯. 北京:中國人民大學出版社,2002.

          [6]Rabin, Matthew. Incorporating Fairness into Game Theory and Economics[J]. The American Economics Review,1993,(83):1291-1302.

          [7]Rabin,Matthew. A Perspective on Psychology and Economics[J]. European Economic Review,May 2002,46(4-5):657-685.

          [8]Rabin,Matthew. Review of Arrow, K., Colombatto, E., Perlman, M. and Schmidt, C. (eds.)[A]. The Rational Foundations of Economic Behaviour[C]. Macmillan Press Ltd, 1996, Journal of Economic Literature,December 1997,35(4):2045-2046.

          [9]Rabin,Matthew. Incorporating Behavioral Assumptions into Game Theory[A]. James Friedman (ed.). Problems of Coordination in Economic Activity[C]. Norwell,MA:Kluwer Academic Publishers,1994.

          [10]Rabin,Matthew. Fairness in Repeated Games[R]. Berkeley Department of Economics Working Paper,January,1997:97-252.

          責任編校:周全林

          A Model Incorporating Fairness into Principal――Agent: a Contribution from Behavior Economics

          Pu Yong-jian

          (Chongqing University, Chongqing400044)

          Abstract:By incorporating Rabin’s concept of fair gambling intothePrincipal――Agent model,this paper develops a new model featuring the irrational behavior of the agent’s showing reciprocity, whereby an agency agreement can be reached to maximize thebenefitand producea higher profit thanfrom Holmstrom―Milgrom optimal Principa―lAgent contract. The new model can help to illustrate the humanization management of businesses and account for the development of this kind of corporate culture. The paper is an attempt to combine behavior economics and incentive mechanism theory and makes an innovative exploration into the construction of the structure of the information economics using behavior economics principle.