首頁 > 文章中心 > 博弈論的基本原理

          博弈論的基本原理

          前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇博弈論的基本原理范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

          博弈論的基本原理范文第1篇

          關鍵詞:獨立董事;博弈

          一、引言

          獨立董事指具有完全獨立意志,代表全體股東和公司整體利益董事會成員。我國絕大部分上市公司按照證監會的要求,在公司董事會中引入了兩名以上的獨立董事。經過近幾年的運行實踐,業界普遍認為,雖然獨立董事在一定程度上改善了上市公司治理結構,但獨立董事的作用沒有充分的發揮。獨立董事缺席董事會會議、對公司的重大交易聽之任之、做重大經營決策時“搭便車”等現象普遍存在,有關實證研究表明,我國獨立董事與公司業績只有非常微弱的正相關關系。獨立董事的作用不能充分發揮,固然有其各方面主觀或客觀的原因,但獨立董事在與被監督對象――大股東與經營者博弈中處于劣勢則是問題產生的根源。本文運用博弈論基本原理,剖析了獨立董事制度失效的原因,提出通過完善獨立董事制度,改善博弈雙方的信息和支付,并由此改變博弈雙方的行動和戰略,充分發揮獨立董事的作用。

          二、分析方法

          博弈論是研究多個決策主體的戰略選擇問題的理論,其中的核心概念是納什均衡。通過對納什均衡的分析,揭示了一項制度充分發揮作用的前提條件,即制度安排所涉及的戰略是行為者最優戰略的組合,也就是一種納什均衡。

          從博弈論的角度來看,獨立董事制度的引入恰恰是資產所有者(股東)與資產經營者(公司高層管理人員)博弈的結果。原有董事會的失靈,破壞了原有的均衡狀態,需要引入獨立董事制度,建立起新的均衡關系,克服董事會失靈,解決公司“內部人控制”問題。

          三、模型分析

          本文用博弈論的基本原理,建立獨立董事與股東之間以及獨立董事與經營者之間兩個博弈模型,對獨立董事的博弈行為進行分析。

          (一)獨立董事與大股東的博弈

          大股東與獨立董事的博弈分為兩個階段:第一階段發生在上市公司在聘用獨立董事時,第二階段則發生在獨立董事被聘用后。因為上市公司必須聘用獨立董事,所以本文對第一階段的博弈不做分析,著重分析博弈的第二階段。

          在此階段,大股東和獨立董事的行動策略是共同知識,所以博弈屬于完全信息博弈,又雙方的行動存在時間上的先后,因此博弈屬于動態博弈,即大股東和獨立董事在此階段的博弈屬于完全信息動態博弈。

          基本假設:一是獨立董事和大股東都是理論上的理性人,都追求自身效用的最大化。二是博弈雙方獲取的信息是對稱的。三是博弈雙方的收益包括經濟和聲譽兩個方面。四是大股東可能存在違規與合規兩種行為,即其戰略空間為(違規,合規),獨立董事在觀察到大股東的行動以后可能會對這種行為選擇發表獨立意見或不發表對立意見,即其戰略空間為(發表,不發表),獨立董事選擇行動后博弈結束。五是大股東選擇違規的情況下,獨立董事如選擇發表意見,會受到來自管理層的壓力如更換獨立董事等,這是給獨立董事帶來的損失Ip。同時大股東也會有一個聲譽損失Lr,這時雙方的支付函數為(L-Lr,I-Ip);若獨立董事選擇不發表意見,這時大股東與獨立董事可能分別獲得額外收益Ld和Id,但雙方的合謀可能受到監管當局的查處,假設合謀受到查處的概率為r,這時雙方的物質損失和聲譽損失分別為Lc,Lr和Ic,Ir,此時雙方支付函數為:(L+Ld-r(Lr+Lc),I+Id-r(Ir+Ic)),在大股東選擇合規情況下,雙方的支付函數為(L,I)。具體的博弈樹,如圖1所示:

          根據圖1的博弈樹,本文采用逆歸納法對此模型求解:在此博弈的第二階段,獨立董事是否會對大股東的違規行為發表意見取決于其收益,根據理性人的假設,獨立董事會選擇使自己獲得最大收益的戰略。由上圖可見,如果獨立董事選擇發表意見,其效用為I-Ip,如果選擇不發表意見,則其效用為I+Id-r(Ir+Ic)。現實情況中,我國對于獨立董事與大股東之間的合謀缺乏完善的查處機制,即r非常??;另一方面,獨立董事選擇不發表意見后,其所獲得的額外收益Id非常大,顯然有I+Id-r(Ir+Ic)1-Ip>I-Ip,即不發表獨立意見成為獨立董事在該階段的最優策略。在博弈的第一階段,大股東同樣作為一個理性人,預測到獨立董事在第二階段會選擇不發表,其行為選擇取決于L與L+Ld-r(Lr+Lc)的大小,根據前面分析,顯然有Ld-r(Lr+Lc)>0。因此,此博弈出現惟一的一個子博弈精練納什均衡(違規,不發表),即“雙方合謀”。由上面的分析可以看到,獨立董事能否發表獨立意見是大股東與獨立董事之間基于收益與成本上的理性選擇,是一套制度安排的結果。如果加大違規成本,降低合謀收益,將促使雙方的博弈均衡點離開“合謀”,從而促使獨立董事發表獨立意見。

          (二)獨立董事與經營者的博弈

          在此博弈模型中,參與人是獨立董事和經營者。經營者的戰略空間是(合作,不合作),獨立董事的戰略空間是(積極作為,消極作為)。假定獨立董事積極作為的成本是C,消極作為的成本是0;經營者合作的成本是YC,不合作的成本是NC。

          在不同條件下,參與者的收益情況設定如下:在經營者合作條件下,獨立董事積極作為的收益是R1,消極作為的收益是0;在經營者不合作條件下,獨立董事積極作為的收益是R2,消極作為的收益是0。其中獨立董事充分發揮效用的概率是P,經營者合作的概率是Q,即在此處引入“混合戰略”的概念。

          當獨立董事選擇積極作為時,其收益Ud1=(R1-C)×Q+(R2-C)×(1-Q)=(R1-R2)×Q+R2-C;當獨立董事選擇消極作為時,其收益Ud2=0×Q+0×(1-Q)=0。顯而易見:Ud1Ud2時,Q(C-R2)/(R1-R2);Ud1Ud2時,Q(C-R2)/(R1-R2);Ud1=Ud2時,Q=(C-R2)/(R1-R2)。

          當經營者選擇合作時,其收益Uj1=(R1-YC)×P-YC×(1-P);當經營者選擇不合作時,其收益Uj2=(R2-NC)×P+0×(1-P)=(R2-NC)×P。同樣有:Uj1Uj2時,PYC/(R1-R2+NC);Uj1Uj2時,PYC/(R1-R2+NC);Uj1=Uj2時,P=YC/(R1-R2+NC)。

          綜合以上分析,如果經營者合作的概率小于(C-R2)/(R1-R2),獨立董事積極作為的期望收益小于消極作為的期望收益,這將導致獨立董事消極作為;如果經營者合作的概率大于(C-R2)/(R1-R2),則獨立董事積極作為的期望收益大于消極作為的期望收益,這將導致獨立董事積極作為;如果經營者合作的概率等于(C-R2)/(R1-R2),獨立董事積極作為的期望收益等于消極作為的期望收益,此時,獨立董事在選擇積極作為或消極作為是無偏好的。

          如果獨立董事積極作為的概率小于YC/(R1-R2+NC),經營者合作的期望收益小于不合作的期望收益,經營者將選擇不合作;如果獨立董事積極作為的概率大于YC/(R1-R2+NC),經營者合作的期望收益大于不合作的期望收益,經營者將選擇合作;如果獨立董事充分發揮效用的概率等于YC/(R1-R2+NC),經營者合作的期望收益等于不合作的期望收益,此時,經營者在選擇合作或不合作上是無偏好的。

          四、結論及政策建議

          (一)結論

          通過分析,得出兩個結論:一是在現有的公司法人治理結構下,由上市公司選聘獨立董事難以真正發揮獨立董事的監督作用,獨立董事未能有效地監督和制約上市公司的行為。二是獨立董事與大股東合謀問題,在現有監督體制下無法得到有效解決。

          通過對獨立董事與經營者的博弈模型的分析,可以發現此博弈的納什均衡與獨立董事積極作為的成本C,合作及不合作條件下預期收益(R1或R2),以及經營者選擇合作或不合作的策略成本(YC或NC)有關。換言之,博弈的結果能否達到預期目標不但取決于獨立董事、經營者各自的支付成本,很大程度上還取決于(合作、不合作)條件下兩種預期收益的差額(R1-R2)。因此,在進行獨立董事制度的構建時,對于上述因素應給予足夠的重視,創造實現納什均衡的條件,以使制度的效用充分發揮。

          (二)政策建議

          首先,必須改變獨立董事的聘任方法。將獨立董事的聘用決定權交給證監會,其行為將與上市公司無關,有效行使監督職責是證監會聘用獨立董事的唯一標準。從獨立董事的角度看,盡責行為付出的成本小于回報,會最大限度地履行職責,以期得到證監會的信任和繼續得到聘用。

          其次,完善獨立董事的激勵機制,刺激獨立董事積極履行職責,多做貢獻。一是聲譽激勵。獨立董事發揮作用的動力來源于其維持自身聲譽的努力,在上市公司中表現出應有的獨立性和客觀性,無形中將極大地保護和提升他們的聲譽,并由此產生相應的收益,在一定程度上避免獨立董事與執行董事之間的“合謀”。二是薪酬激勵。采取給予報酬和持股計劃以促使獨立董事更加積極認真地投入工作,獨立董事在其從事的領域乃至社會上具有較高的知名度和良好的聲譽,必須有相對固定的薪酬以其心理上得到平衡。三是權利激勵。授予獨立董事必要的控制權,如提名、審計、監督、評價等。獨立董事必須具有監督權、審核權、否決權。

          參考文獻:

          1、張維迎.博弈論與信息經濟學[M].上海人民出版社,1996.

          2、施錫銓.博弈論[M].上海財經大版社,2000.

          3、孟明.獨立董事的激勵機制[J].企業改革與管理,2003(11).

          4、張凡.關于獨立董事制度幾個問題的認識[J].管理世界,2007(2).

          5、胡金焱,丁士祥.我國上市公司獨立董事制度的博弈分析[J].山東大學學報社會科學版,2003(3).

          6、林凌,常誠.獨立董事制度研究[J].證券市場導報,2000(9).

          7、何問陶,王金全.我國獨立董事制度的實證分析[J].財貿經濟,2002(9).

          8、饒玉蕾,李永紅.獨立董事制度失效的博弈分析[J].湖南財經高等??茖W校學報,2003(5).

          9、譚勁松.獨立董事與公司治理:基于我國上市公司的研究[M].中國財政經濟出版社,2003.

          博弈論的基本原理范文第2篇

          關鍵詞:入行論;博弈論;思想;辯證

          《入行論》全稱入菩薩行論,是印度那爛陀寺寂天菩薩[1]所著,所作年份不詳,該論典是是大乘佛教諸多典籍中較為重要的論著,正如索達吉堪布在《入行論廣釋》中說:“《入菩薩行論》是修學大乘佛法者不可缺少的論典。在藏傳佛教各派中,每一個正規寺院里的修行人,都會傳講聽習此論;而且已形成一種普遍觀念,認為如果要做真實的修行人,必須精通《入菩薩行論》 ”[1]。佛學中將論著分為四類:言簡而義深、言繁而義淺、言簡而義淺、言繁而義深。其中最佳的當屬言簡而義深的一類,而《入行論》正是屬于這一類論著,其中所闡述的內容精辟而深刻,運用了諸多比喻,系統的示解了大乘佛法修行者所要修行的步驟及方法。九世紀初,《入菩薩行》傳入藏地,歷代高僧大德廣泛弘揚,至今也留下了二十余部注疏,使其成為地區膾炙人口的一部寶典,也成為了藏傳佛教中修行者的必修論典。這部論典中所闡述的價值觀,也是佛教教育者們的價值觀,是以利他菩提心為主,不單講不能偷盜邪、要尊師重道、知禮義廉恥、回報社會、尊老愛幼,更甚者講到除人類外的所有有生之物,都要營造無害、和諧,這種思想也就必然對后人起到了影響。

          博弈論(Game theory)又稱之為對策論、游戲論,現在已發展成為現代數學的一個分支,被當作運籌學的一個重要研究對象和方法。1928年馮?諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮?諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》,開啟了博弈論思想的系統化研究浪潮。然而,這一論著并非最早提出博弈的著作,其實早在戰國時期,孫武所作的《孫子兵法》,可以說是最早的一部講述博弈的著作。隨之便出現了諸多研究博弈,以博弈思想為基石創作諸多方方面面的著作,也成為了風靡一時的青少年讀物,更甚者以此為自己的價值觀,出現了諸多效仿的事跡。但大風大浪過后,回頭審視這一行徑,才恍然發現博弈論帶來的不完全只有利益,更多的是磨滅了傳統思想中正面和積極、人性化的部分,這點值得研究和考慮。

          一、《入行論》所闡述的主要思想

          《入行論》一書的創作背景具有特殊性和局限性,其特殊性表現在,它是作于一個佛法盛傳的那爛陀寺,而且作者又是一位得道修行者,其局限性在于作者是出家人,又置身寺院中,從科學理論的角度而言,是具有一定的局限性的。而論著中主要講大乘深觀和廣行法,主要以廣行法為主,講解如何修心、修行應當持有怎樣的心態等。這部論著分為十品,第一品講發菩提心的利益,第二品講懺悔罪業,第三品講受持菩提心,這三品就是為了“未生者當生”,沒有生起菩提心的令生起菩提心。第四品講不放逸,第五品講正知正見,第六品講安忍,這三品是為了“已生勿退失”,相續中已經產生了菩提心,但這也是很容易退轉的,這三品是為了令生起的菩提心不退轉。第七品講精進,第八品講靜慮(禪定),第九品講智慧品,第十品講回向品,這四品是講“輾轉益增長”,為了已經具有的菩提心能夠增長,甚至圓滿。整部《入行論》就是為了未生的菩提心能夠生起,已經生起的不退失,而能夠增長[2]。其中以諸多比喻形象而生動的喻說了善惡取舍,正如《入行論》中將人身比作過河之乘舟,將最終的和諧當做彼岸,為得到這種人與人、人與自然的和諧而只為利他。

          二、博弈論所涵蓋的主要思想

          博弈思想簡單概括就是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的意義。也就是二人對局如何占優。以博弈中的要素:參與者、各自的策略、得失(或者支付矩陣)、次序等達到均衡。理性的參與者為了使自己的利益最大或者損失最小并結合對方的處境等指導作出決策達到均衡。甚至犧牲他人的利益,將自己的利益最大化。

          正如其中典型的海盜分金、囚徒困境等等舉例,大致將可以涵蓋和解釋其內在的思想角度。在軍事戰略、游戲、統籌等學科,這一理論無疑是極具指導價值的,但在倫理人情中,尤其是東方文化中是否可行,這一論點值得探討和研究。

          三、兩者的辯證關系

          《入行論》的菩提思想與博弈思想,兩者即統一又對立,其統一點在于,兩者最終都是致力于求得最大的功利,這點是完全相同的。二者又有著對立的一面,因為菩提心不僅為了今生得到功利,還致力于來世,所做一切都是為了得到和諧、善果,甚至為得到和諧不惜失去生命的大愛。而博弈論則不同在于它不承認來世,所以只致力于眼前的現世今生,所求的是物質上的利益,甚至是將自己的利益建立在別人的損失之上,甚至認為任何別人的付出都是“有原因”的,極度機械化的價值觀,不利于處理倫理、友情等問題,因為有些時候人與動物的區別正在于此,在于貢獻和無私付出,在于“利他”。

          注釋:

          [1]寂天菩薩:印度南方賢疆國王太子,原名寂鎧,出家來到那爛陀寺后,依當時寺內五百班智達之首的勝天為親教師出家,法名寂天。

          參考文獻:

          [1] 索達吉堪布著. 《入行論廣釋》[Z] . 智悲佛網電子版記述.2013:2.

          博弈論的基本原理范文第3篇

          在我國旅游業高速發展的今天,作為旅游業的三大之柱之一的酒店業也取得了很大的成績,但在發展的過程中也存在一些問題,如各星級酒店發展的不平衡,酒店內部管理體制問題,基層員工的離職率較高等,本文以酒店業為背景,運用了博弈論的基本原理,建立數學模型,應用動態博弈模型研究來員工與經理的多階段博弈問題,討論了酒店發展過程中的員工的離職問題,談到了如何才能降低離職率,同時也給出了優化酒店管理的合理化的建議。

          一、模型中數據參數的假定

          在酒店里,作為酒店的管理者,作為股東的人,他要對員工的日常工作情況進行監督和管理,下面是他和員工在工作中的一些參數的假定設置。

          1.酒店經理一旦進行監督就能發現酒店員工是否努力。2.假設酒店員工工作努力就不會離職,所以也無需考慮經理是否會進行教育,當經理不監督時也不存在教育與離職的問題,即沒有博弈樹下面的分支了。3.當員工工作不努力時,客人們可以能會將酒店員工的不努力行為擴散給其他人,這樣酒店經理的聲譽會損失,設為。4.經理進行酒店日常的管理工作,股東賦予他的管理經費為M,這也是工資的一部分,經理的監督成本,酒店員工的努力成本為,F為經理不教育時對不努力的員工的罰金,(注意這里教育則不罰款了)假設員工離職向經理交事先勞動合同上的違約金為,這個可以對員工起到一定的約束作用。5.經理不教育不努力員工時,經理教育不努力的員工時,教育成本為J。經理出于短期效益,對于不努力的員工,他希望罰款,而董事會的股東們則更希望他通過教育,讓他們接受愛崗敬業,接受企業文化的教育,增強團隊凝聚力,這有利于酒店長遠的發展,所以本節后面有一個股東對經理的監督與否的問題。6.員工將要離職時對外界有個期望值R,當期望高時,對他是一種離職的誘因。7.當員工工作不努力時,經理自身的聲譽損失為;經理一旦監督,發現了員工不努力時,酒店員工聲譽損失為;員工努力時,其聲譽得益為;當經理通過教育后員工不離職了,則經理的聲譽損失為。這里要說明一下,聲譽損失再這里主要表現的是一種量變關系,當然我們也可以把賦予它一定的實際意義,比如經理的聲譽損失可以在股東召開股東大會在季度獎、年終獎時給予體現,而員工聲譽損失、聲譽得益也可以由經理對他的努力情況進行評價后,在他的獎金中設置給予一定的份額來體現。8.設經理監督的概率為,不監督的概率為1-,員工工作努力的概率為,員工工作不努力的概率為1-,經理不教育的概率為,經理教育的概率為1-,員工離職的概率為,員工不離職的概率為1-。9.設最底層經理與員工的期望收益分別為11、12,上一層經理與員工的期望收益分別為21、22

          該模型的博弈樹如圖1所示,樹中顯示了經理與員工在多個階段的動態博弈,根據假定條件與博弈樹可以確定圖1中各參與人在結點①-⑧的收益值,即有:

          二、博弈模型的求解

          采用逆向歸納法求此動態博弈的均衡解,即從博弈樹的最低層開始,組成考察每層的經理與酒店員工的期望收益,具體過程如下:

          1)從最底層考察酒店員工離職與經理不教育的情況,分別求出酒店經理與員工的期望收益,用11、12表示,涉及到決策點②、③、④、⑤

          則這個階段經理的期望收益

          (1)

          則員工的期望收益

          (2)

          對式(1)、(2)求一階求導,并取:

          從而得在這一階段二者的均衡解為

          (3)

          2)在討論了上面這個階段的情況后,再考察酒店員工是否努力及經理是否監督這一層次,涉及決策結點①、⑥、⑦、⑧,用21、22分別表示本階段經理和酒店員工的期望收益。

          本階段中,在決策點處

          對于經理

          (4)

          對于員工

          (5)

          對(4)、(5)求一階條件,并取

          從而均衡解為:

          (6)

          三、對上述的均衡結果分析

          上面通過數據的假定,求出了在各個階段經理與員工之間的均衡策略,即最底層的考察酒店員工離職與經理不教育的情況,分別求出酒店經理與員工的期望收益,當討論了上面這個階段的情況后,再考察酒店員工是否努力及經理是否監督這一層次,分別求出了本階段經理和酒店員工的期望收益,然后依次求導后,得出了下面的均衡概率,下面對上述結果給予分析。

          由上述求解過程可得模型的均衡解為:

          (7)

          1)均衡條件下為經理監督的概率,由可知:

          ①酒店員工努力成本C2越高,經理監督的概率越大,因為酒店員工的努力成本越高,酒店員工不努力的概率越大,因此經理為促使酒店員工努力就需提高其監督概率。

          ②酒店員工努力的聲譽得益越大,酒店員工努力可以得到承認,那么酒店員工越敬業,即使經理不監督,酒店員工仍然努力,所以,此時經理監督的概率就越小。

          ③1*2越大,不努力酒店員工的損失越大,酒店員工為了避免這種損失就需要努力工作,在這種環境下,可降低其經理監督概率。

          2)是酒店員工努力的概率,由可知:

          ①C1越大,越小,因為經理的監督成本越高,造成經理監督概率越小,導致酒店員工越會降低其努力積極性。

          ②越大,這表明經理在第一階段的收益越大,而這個收益與不努力酒店員工在這個階段的損失相關,也就是說越大時不努力酒店員工的損失越大,為了避免這種較大的損失,酒店員工努力的概率越大,即越大。

          ③M越大,股東賦予經理的管理費用越多,經理越會加強監督,執行股東的想法,員工自然會努力工作了。

          3)為經理不教育不努力員工的概率,由可知:

          ①J越大,越大,當教育不努力的員工成本太高時,經理顯然越不會去教育員工了,而會選擇罰款。②越大時,越小,員工意識到不努力帶來的聲譽損失太大,有可能被解雇的危險,必然會努力工作,自然就不會發展到下一步需要經理去罰款了。③R越大,越小,當員工對外界有一個較大的期望時,此時員工是最容易離職的,那么此時若經理只是簡單的罰款,只會加速員工的離職,因此只能是教育了,教育的概率加大了,不教育的概率變小了。④越大,越大,這是因為我們可以借助后面模型帶來的股東情況,當員工因離職要交的違約金越多時,員工因不愿意交這部分違約金,而會努力工作,則經理高忱無憂,不教育的可能性是顯然增大了。

          4)為酒店員工離職的概率,由可知:

          博弈論的基本原理范文第4篇

          關鍵詞:演化博弈;品牌;價值體驗;自主創新

          中圖分類號:F713.50 文獻標識:A 文章編號:1674-9448 (2013) 04-0061-10

          An Evolutionary Game Model about Independent Innovation Based on Experience of Brand Value

          GUO Ben-hai1,2 LIU Si-feng2(1. School of Management, Jiangsu University, Jiangsu Zhenjiang 212013, China,2. School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Jiangsu Nanjing 211100, China)

          Abstract: From a market perspective, enterprise independent innovation must adhere to category innovation and brand strategy as the core, create new category different from competitors’ or even the opposite one and make consumers get more experience of brand value. This is not only the respect for the generalized virtual value demand, but also the mark of enterprise market success by independent innovation. The enterprise independent innovation based on brand value experience is a comprehensive system which Includes activities such as concept innovation, technology innovation and service innovation and so on. Whether enterprise will devote to this complicated and high-risk innovation activities not only depends on the interests of the enterprise itself, but also is affected by the policy environment and competitors. Facing the dilemma and incentives of enterprise brand building, the bounded rationality and incomplete information evolutionary game theory are applied to analyse the strategies and earnings of main game parties during the enterprise innovation process on brand value experience. An “enterprise-enterprise” and “enterprise-government” evolutionary game model is established to solve and seek evolutionary stable strategy.

          Keywords: evolutionary game, erand, value experience, independent innovation

          一、引 言

          美國著名未來學家阿爾文?托夫勒曾指出,體驗經濟將逐漸成為繼農業經濟、工業經濟、服務經濟之后的一種經濟形態[1]?,F時代經濟社會生活與過去相比,發生的顯著變化是大批只具有虛擬價值的商品涌入商品大家族[2],虛擬價值在本質上是社會心理需求對商品價值的再造[3]。作為經濟活動微觀主體的企業,必須在提高提供顧客體驗價值的過程中獲取競爭優勢;以品牌價值體驗為導向的自主創新活動,將會是企業發展的不竭動力。中國企業之所以難出國際知名品牌,缺少的就是在消費者心中的品牌價值認知度;自主品牌產品少、品牌價值偏低,是我國企業自主品牌建設的基本現狀。提升消費者的品牌價值體驗度和認知度,已經成為擺在中國企業面前的當務之急問題。

          理論界對自主知識產權品牌建設及演化博弈問題做了多方面研究。張明立[4]從消費者―品牌關系中的廣義虛擬價值角度探索品牌形象對品牌忠誠的作用機制;劉明珍 [5]通過數據研究方法,提出從內在機制、建立法規、統一內外資企業所得稅等方面支持我國企業自主知識產權產品發展的政策建議;黃永春,楊晨 [6]以品牌競爭理論為基礎,從外顯性與潛力性構面探究了企業自主知識產權名牌競爭力的構成要素;范秀成 [7]從服務的過程屬性出發,闡述了服務企業品牌建設的焦點應該是顧客體驗,并提出通過塑造顧客體驗來創建服務品牌的策略。

          對演化博弈論發展具有開創性貢獻的是 Smith [8]與Price [9],他們提出的“演化穩定策略”成為演化博弈論的基本概。近年來,演化博弈研究出現了一些新動向。如L.A. Bach,T.Helvikc,F.B.Christiansen [10]研究了演化穩定策略(ESS)的分歧問題;David K. Levine,Wolfgang Pesendorfer [11]對有一方模仿情況下的合作演化博弈問題進行了相關研究;韓少春等 [12]在演化博弈論的基礎上,分析輿論傳播的羊群效應問題。在演化博弈應用領域,郭本海、方志耕 [13]運用演化博弈的基本原理,分析了中國節能政策實施中中央與地方的演化博弈策略,提出“中央―地方”演化博弈的三個階段;阮愛清、劉思峰 [14]運用演化博弈模型分析了產業集群的種子、核和集群三種狀態及不同階段的收益狀況,建立了產業集群成長的演化模型;周德群 [15]基于非對稱主體的進化博弈方法,探討了不同規模的企業在新興產業進入問題上的對策;謝非 [16]應用進化博弈論的方法從風險投資者和風險企業的角度,結合風險資本的時間價值,對風險投資退出方式進行了研究;劉偉兵、王先甲 [17]將強化學習引入到進化博弈中,建立了進化博弈中的多人強化學習模型。

          本文在已有研究基礎上,從顧客的品牌價值體驗入手,分析企業創新過程中各方利益主體的博弈關系以及品牌價值體驗與企業自主創新的作用機理;構建了“企業―企業”及“企業―政府”為博弈雙方、以提升品牌價值體驗為基本目的的自主創新演化博弈模型,通過模型求解,闡釋各方主體的演化穩定策略。

          二、提升品牌價值體驗的自主創新博弈關系分析

          演化博弈理論源于生物進化論,其基本思想是,在具有一定規模的博弈群體中,博弈方進行著反復的博弈活動;相對于靜態均衡和比較靜態均衡,演化博弈強調動態均衡。演化博弈以有限理性和學習能力代替了傳統博弈論關于主體完全理性的假定, 即博弈雙方不可能在每一次博弈中都能找到最優的均衡點;演化博弈以一種動態的框架來分析系統均衡及達到均衡的過程,從而更準確地描述系統的發展變化。演化博弈的核心概念是“演化穩定策略”( Evolutionary Stable Strategy, ESS ) 和“復制動態”(Replicator Dynamics)。

          以提升顧客品牌價值體驗為根本訴求的企業自主創新活動,既要考慮到創新的不確定性、外部經濟性等風險,又要深度理解并充分尊重市場需求,這個過程實際上是不同企業、政府部門、消費者和社會公眾等主體間的復雜博弈。其中,不同企業的策略選擇、政府的政策設計與選擇將在很大程度上影響著博弈態勢,企業與企業之間、企業與政府之間的博弈占據主導地位。在不同的政策體系下,各方博弈主體的收益預期會有所不同,相應的博弈策略也不斷調整。一方面,企業將根據政策特點及競爭對手的策略采取相應的行動,決定是否全力置身于自主創新和自主品牌建設;或者根據已選擇的創新模式以及政府的政策作用效力估測收益趨勢,對已有創新模式做出相應調整。另一方面,政府根據政策執行的情況評估政策效力、判斷品牌建設未來發展趨勢,并對現有政策做出相應的調整。

          (一)損益變量選取

          (1)影響企業自主創新的損益變量

          初始收益M:企業在不創新且不“搭便車”情況下所獲得的經營利潤;

          自主創新邊際收益V:企業因自主創新而獲得的直接收益;

          自主創新衍生收益E0:企業因自主創新而獲得的間接收益;

          創新基礎設施投入G:政府在創新基礎設施建設上的投入,以減輕企業基礎性成本負擔;

          “搭便車”收益E:不從事創新的企業“搭便車”獲得包括初始受益在內的收入,令 ,E=M+ηV;η∈(0,1);

          創新直接成本I0:企業自主創新所發生的直接支出;

          “搭便車”成本H:不從事創新的企業“搭便車”所產生的必要費用;

          懲罰費用C0:“搭便車”可能被查處而遭受的懲罰,令C0=βI(β為懲罰系數,I為從事創新的企業在某個方面的創新投入);

          (一)損益變量選取

          1.影響企業申請知識產權保護的損益變量

          初始收益M:企業在不創新且不“搭便車”情況下所獲得的經營利潤;

          自主創新邊際收益V:企業因自主創新而獲得的直接收益;

          品牌溢出價值B0:自主創新提高了產品知名度和品牌價值體驗度,企業因此而獲利,可令B0=λM0=λ(M+V)0,λ為品牌價值溢出率,λ∈(0,1);

          讓渡收益O:企業通過知識產權買賣、轉讓而獲得的收益;

          政府激勵G0:企業積極申請知識產權保護而獲得的來自政府的獎勵收益;

          賠償收益P:申請了知識產權保護的企業獲得的來自“搭便車”侵權企業的賠償;

          保護成本K:企業實施知識產權保護產生的成本費用;

          知識產權溢出損失B1:因企業不申請知識產權保護或政府不監督,企業被侵權而導致利潤減少;

          品牌價值折損B2:因企業品牌建設不力或政府監督弱化,品牌價值折損導致企業收益相應減少。

          2.影響政府監督的損益變量

          行政收費Y:政府向申請知識產權保護的企業收取的費用;

          衍生收益W:政府因在知識產權保護上的有力作為(監督)而無形收益,如政府形象及區域形象改進等;

          罰沒收入P:政府依法對“搭便車”企業實施罰沒懲戒而獲得的收益;

          獎勵支出G0:政府對積極申請知識產權保護的企業給予的獎勵;

          監督成本C:政府實施監督過程中消耗的人、財、物成本;

          衍生損失W’:政府因在知識產權保護上不作為可能帶來的負面影響,如區域形象受損、投資環境質量下降等。

          (二)收益函數構建

          1.支付函數構建

          假定:政府知識產權保護上采取“監督”策略的概率為p,則不監督(或監督力度不力)的概率為(1-p);企業申請知識產權保護的概率為q,則不申請知識產權保護的概率為(1-q)。令企業申請知識產權保護的情形為F1,不申請知識產權保護的情形為F2;政府部門進行監督的情形為G1,不進行監督的情形為G2。雙方的收益矩陣如表2所示。

          五、結束語

          解決我國企業自主品牌產品少、品牌價值偏低的問題,是一個系統工程,企業、政府、消費者以及社會公眾皆在其中扮演著重要角色;以企業為基本主體、以政府為重要推動力量、以提高顧客品牌價值體驗程度為根本訴求的自主創新,是解決這一系統性問題的關鍵。 圍繞這一問題而展開的“企業-企業”間及“企業-政府”間演化博弈,實質上是有效構建科學調控機制,促使具有競合關系的不同企業與政府一起構成策略互動體,以演化穩定策略順利推進基于品牌價值體驗的企業自主創新活動。

          參考文獻:

          [1] 阿爾文?托夫勒著.未來的沖擊[M].蔡伸章譯.北京:中信出版社, 2006.

          [2] 林左鳴.虛擬價值的人類活動論依據[J].北京大學學報(哲學社科版),2006(2):43-50.

          [3] 吳秀生.虛擬價值:價值規律的新視野[J].廣義虛擬經濟,2011(4):36-45.

          [4] 張明立,任淑霞,王偉.基于廣義虛擬價值的品牌形象對品牌忠誠影響機制研究[J].廣義虛擬經濟研究,2011(3):38-46.

          [5] 劉明珍.中國企業自主知識產權和知名品牌發展研究[J].中國軟科學,2006(3):123-130.

          [6] 黃永春,楊晨.企業自主知識產權品牌的競爭效應的理論分析[J].科技管理研究,2007(4):27-33.

          [7] 范秀成.顧客體驗驅動的服務品牌建設[J].南開管理評論,2001(6):123-131.

          [8] Maynard Smith J. The Theory of Games and the Evolution of Animal Conflict[J].Journal of Theory Biology,1973, (47).

          [9] Maynard Smith J, Price G R. The Logic of Animal Conflicts [J]. Nature, 1974 (246):15-18.

          [10] L.A. Bach, T. Helvikc, F.B.Christiansen. The evolution of n-player cooperation-threshold games and ESS bifurcations [J].Journal of Theoretical Biology,2006, 238.

          [11] David K. Levine, Wolfgang Pesendorfer. The evolution of cooperation through imitation [J]. Games and Economic Behavior,2007,58.

          [12] 韓少春,劉云,張彥超 等.基于動態演化博弈論的輿論傳播羊群效應[J].系統工程學報, 2011(2):275-281

          [13] GUO Benhai, FANG Zhigeng.A study of evolutionary game between central government and the local in energy conservation policy implementation[C]. 2011 IEEE International Conference, 2011(9):874-879.

          [14] 阮愛清,劉思峰.基于進化博弈模型的產業集群成長研究[J].科學學與科學技術管理, 2008(2):91-95.

          [15] 許肖瑜,周德群.基于進化博弈的新興產業進入問題研究[J].技術與創新管理, 2008(11):600―606.

          博弈論的基本原理范文第5篇

          [關鍵詞]博弈論;理性人假定;公共知識;社會科學方法論

          [中圖分類號]C3

          [文獻標識碼]A

          [文章編號]1671-511X(2012)04-0020-03

          博弈論是研究理性人的互動的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統應用于經濟領域,奠定了這一學科的基礎和理論體系。1950-1951年,約翰·納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅定的基礎。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發展。因此,盡管博弈論是一門新生的學科,但是它今天已經發展成為有較完善的理論體系的科學。

          今天,博弈論已經成為社會科學的通用方法論。盡管它是演繹科學,對社會現象有強大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實際博弈結果存在差異。許多實驗經濟學家通過博弈實驗研究實際中人們的博弈過程,分析博弈論的演繹解與博弈實驗結果之間的差異。如2002年諾貝爾經濟學獎就頒發給了丹尼爾·卡尼曼和邁農·史密斯,他們是實驗經濟學的先驅。今天在西方學術界通過實驗來驗證博弈的理論結果已經成為一種潮流。本文下面設計并進行了一個博弈實驗,通過分析實驗結果與理論解的差異,分析博弈論作為社會科學方法論的局限性,并提出改進的可能路徑。

          一、博弈實驗及結果分析

          1 實驗描述

          我們設計了如下的一個博弈實驗。該實驗的參與人是南京大學選修文化素質課“邏輯與科學方法基礎”的大學生,他們是二三年級的學生,文理科學生均有。

          該實驗是以試題的形式進行的,該試題作為期末試卷中的最后一道題。該題目為:

          在0-100之間選擇一個數字,規則是:若你選擇的數字“是或最接近”在座同學所選擇的數字的平均數的2/3(即在座同學所選數的總和除以總人數之后所得數字的2/3,如:若平均數為90,你應當選2/3×90=60),你將獲勝。請給出你選擇的理由。

          實驗說明:

          (1)實驗參與者即參加考試的學生,事前不知道這是一個實驗;

          (2)該課程教師以講座的形式給實驗參與者傳授過博弈論知識,但沒有提到所進行的博弈;

          (3)因為(2),他們中的大多數掌握“博弈”、“公共知識”等概念;

          (4)試卷是保密的,沒有任何學生預先知道考試內容,考試過程中學生間無任何交流;

          (5)該博弈的理論解(即納什均衡)為0或1。

          2 實驗結果

          對于考試中的每個學生,在這個博弈實驗中他能夠獲勝的關鍵是,他要準確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數乘以2/3便是獲勝答案。

          共有176人參加了考試。排除掉5個不明確的選擇,供分析的實際選擇數為171個(其中3個選擇非整數)。實驗結果為(按照數字大小排序):

          “0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。

          3 結果分析

          在這些所選擇的數字中,最大的數字為75,最小的數字為0。171個數字相加后的平均數為21.91,本博弈勝出解:21.84×2/3=14.61。

          這個博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實驗中,0是所選最多的數字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。

          從上述數據可以看出,在這場博弈中,“實驗解”為14.61,最接近該數的是14或15,這和“理論解”的“0”或“1”不同。在本實驗中,沒有人選擇14,而選擇15的有3人,這3人是該實驗的勝出者。

          若按照區間來統計,實驗結果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11-20之間。若我們把11-20看成是勝出區間,則有7人勝出。

          對于這些選擇,有以下值得注意的幾點:

          第一,67以上的選擇都是不理性的,因為參加考試的學生數為150-200之間,這是公共知識,即使所有的學生都選擇100,勝出的數字都不會超過67。但是還有3位學生選擇了大于67的數字,其中選擇的最大數為75。他們在給出這些選擇時沒有給出理由。

          第二,分析學生所給出這些選擇的理由,可以看出,絕大部分選擇者在進行他們的選擇時考慮到了他人的選擇以及他人的推理。不同的人對他人的假定不同,所進行推理的步驟也不同。如選擇67的學生假定了他人都選擇100,因而選擇67是最優選擇;再比如選擇30-40之間的數字的同學,其理由大體上有兩個:或者認為平均數集中在50-60之間,其2/3就集中在35-40之間;或者認為都選100的話,66.7是最優選擇,都選擇66.7的話,44是最優選擇,而都選44的話,33是最優選擇。

          第三,有三個區間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區間的選擇者考慮群體的互動推理的步驟存在差別,如0-10區間的選擇者考慮他人的推理步驟比31-40區間的選擇者多些。

          第四,值得注意的是,11-20區間里的選擇較少(事實上是,在這個博弈中所選擇的數字落在這個區間是最有可能勝出的)。原因可能是,一旦選擇者進行了多步的互動推理,他們便能夠將這樣的推理進行下去,從而將選擇向理論解0或1靠近。

          第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個。一位選擇22的學生是這樣給出他所選擇的理由的:“作為理性人,我不會選擇大于2/3×100的數,因為即使所有人都選擇最大數,平均數的2/3也不會超過2/3×100。如果大家和我一樣理智,那么大家都不會選擇大于2/3×100,那么我不會選擇大于100×2/3×2/3。因為他們選擇最大的他們可能會選的數,平均數的2/3也不會超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會選擇1,然而我不認為班里的人都是足夠理智,故平均數的2/3會大于1。根據兩次游戲,平均數的2/3在20~30。如果是我,我會選擇靠近20的數,那我就22吧?!币粋€選擇10的學生的理由是:“如果其他人都是隨機選擇,那么平均數最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數,那么33為平均數,33×2/3≈22……如此推理應該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心,所以,我將數字選得接近1一點,選10。”

          第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認為60是及格分,所以我選擇59”,“58是我的幸運數字”,等等。

          二、博弈的理論解分析

          本實驗是一個多人完全信息靜態博弈:參與者同時選擇行動,然后根據所有參與者的選擇,每個參與者得到各自的結果,每一參與者的收益函數在所有參與者之間是公共知識。

          在這個實驗中,參加考試的176位學生是參與者,每個考生同時對0-100之間的數字進行選擇行動,即每個參與者的策略空間Si∈(0,100),即有101種可能的策略。根據所有考生的選擇,每個考生最后得出自己的結果,對每個考生來說,結果無非就是,自己的選擇是“大家所選數字的平均數的2/3”,勝出;要么與“大家所選數字的平均數的2/3”不一致,失敗。

          我們假定該博弈的參與人都是絕對理性人(事實上,這個要求在實際中難以達到,這也是本文要得到的一個結論)。

          我們來分析絕對理性人的推理過程。

          在這個博弈中策略組合有176×101種,每種策略組合下,每個人的收益是公共知識。如:如所有人都選100,平均數為100,此時每人都失敗,勝出結果是100×2/3=67;如175人都選100,有一個人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。

          我們看到,任何人都不應該選67或以上,或者選擇67或以上是非理性的,因為所選擇的數字的最大平均數為100,此時勝出的數字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會選擇67或以上。

          每個人都不會選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因為對每個人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。

          每個人都不會選擇45或以上,這本身也是公共知識。于是,每個人都認為不應該選擇30或以上。

          ……

          結論是:每個人選擇0或1是合理的,它們是該博弈的理論解。

          事實上,每個人選擇0或都選擇1是納什均衡:對每個人而言,在其他人不改變選擇的情況下,當下的選擇是最優的。

          在所有人均選擇0的情況下,因為對于每個人而言,若所有人都選擇0的話,0便成為平均數,該數的2/3還是0。這樣,他選擇0是最優選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點構成納什均衡。

          在所有人均選擇1的情況下,同樣,對于每個人而言,在其他人選擇1的情況下,平均數1的2/3為0.67,此時1最接近該數。因此,他選擇1是最優選擇,并且若他改變了他的選擇他將失敗。因此,這點也構成納什均衡。

          當然,面對多個納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個博弈中,每個人要考慮的是,他選擇0還是選擇1才能勝出呢?

          他會這樣思考:沒有理由認為其中一個比另外一個更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數應該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優選擇。

          從上面的分析可見,盡管0和1是納什均衡點,但選擇。是最優選擇。

          三、改進博弈論的可能路徑

          本文已經表明,上述博弈是一個完全信息靜態博弈,然而,本實驗的實驗解(14.61)與理論解(0或1)之間發生偏離。本文認為,有兩個主要原因:

          第一,博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人;他們能夠進行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時完成的,而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應當知道0和1是均衡解,也能夠預測O是最有可能實現的結果。本實驗表明,并不是所有人都能夠做出這樣分析的。并且,在實際中存在完全非理性的選擇,如本實驗中選擇大于67的3人,這不是完全偶然現象。