久久精品色妇熟妇丰满人妻99,久久久网,和少妇疯狂做爰过程,欧美系列亚洲系列国产系列

廊坊新聞網(wǎng)-主流媒體,廊坊城市門戶

貝葉斯納什均衡例題_貝葉斯納什均衡 每日聚焦

2023-06-09 01:00:22 來源:互聯(lián)網(wǎng)

1、貝葉斯納什均衡是指這樣一組策略組合:在給定自己的特征和其他局中人特征的概率分布的情況下,每個(gè)局中人選擇策略使自己的期望支付達(dá)到最大化,也就是說,沒有人有積極性選擇其他策略。

2、動(dòng)態(tài)博弈戰(zhàn)略行動(dòng)在動(dòng)態(tài)博弈中,參與人為了使得其他參與人的選擇對(duì)自己有利,往往采取一些行動(dòng)來影響其他參與人對(duì)于自己行為的預(yù)期。


【資料圖】

3、這些行為稱為戰(zhàn)略行動(dòng)(strategic move)。

4、1.首先行動(dòng)優(yōu)勢(shì)首先行動(dòng)優(yōu)勢(shì)(first-mover advantage)是指,在博弈中首先作出戰(zhàn)略選擇并采取相應(yīng)行動(dòng)的參與人可以獲得較多的利益。

5、2.確實(shí)可信的威脅確實(shí)可信的威脅(credible threat)是指,博弈的參與人通過某種行動(dòng)改變自己的支付函數(shù),從而使得自己的威脅顯得可信。

6、參與人為改變博弈結(jié)果而采取的措施稱為承諾(commitment)。

7、第四節(jié) 不完全信息靜態(tài)博弈在許多情況下,參與人對(duì)對(duì)手的了解往往是不夠精確的。

8、這種情況下的博弈就是不完全信息博弈。

9、舉例來說,某一市場(chǎng)原來被A企業(yè)所壟斷。

10、現(xiàn)在B企業(yè)考慮是否進(jìn)入。

11、B企業(yè)知道,A企業(yè)是否允許它進(jìn)入,取決于A企業(yè)阻撓B企業(yè)進(jìn)入所花費(fèi)的成本。

12、如果阻撓的成本低,那么,正如表7-10后兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是阻撓,博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡――A阻撓,B不進(jìn)入。

13、如果阻撓的成本高,那么,正如表7-10前兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是默許B進(jìn)入,博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡――A默許,B進(jìn)入。

14、B企業(yè)所不知道的,是A企業(yè)的阻撓成本是高是低。

15、這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。

16、某一參與人所擁有的全部私人信息稱為他的類型。

17、在上述例子中,阻撓成本就是 A的私人信息。

18、高阻撓成本和低阻撓成本則是兩種不同的類型。

19、顯然,在這里,B所遇到的,是不確定性條件下的選擇問題。

20、因?yàn)锽不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。

21、解決這類問題的方法之一,就是把不確定性條件下的選擇轉(zhuǎn)換為風(fēng)險(xiǎn)條件下的選擇。

22、在風(fēng)險(xiǎn)條件下,B雖然不知道A的類型,但可以知道不同類型的分布概率。

23、將不確定性條件下的選擇轉(zhuǎn)換為風(fēng)險(xiǎn)條件下的選擇,稱為海薩尼轉(zhuǎn)換(the Harsanyi transformation)。

24、按照海薩尼的方法,所有參與人的真實(shí)類型都是給定的。

25、其他參與人雖然不清楚某一參與人的真實(shí)類型,但知道這些可能出現(xiàn)的類型的分布概率,而且這種概率是公共知識(shí)。

26、用上例來說,公共知識(shí)不僅意味著B企業(yè)知道A企業(yè)高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。

27、通過海薩尼轉(zhuǎn)換,不完全信息博弈變成了完全但不完美信息博弈(games of complete but imperfect information)。

28、這里的不完美信息,就是指其他參與人只知道某一參與人某些方面類型的分布概率,而不知道該參與人在這些方面的真實(shí)類型。

29、在上述轉(zhuǎn)換的基礎(chǔ)上,海薩尼提出了貝葉斯納什均衡(Bayesian Nash equilibrium)。

30、對(duì)此,可以作如下解釋:在不完全信息靜態(tài)博弈中,參與人同時(shí)行動(dòng),沒有機(jī)會(huì)觀察到別人的選擇。

31、給定其他參與人的戰(zhàn)略選擇,每個(gè)參與人的最優(yōu)戰(zhàn)略依賴于自己的類型。

32、由于每個(gè)參與人僅知道其他參與人有關(guān)類型的分布概率,而不知道其真實(shí)類型,因而,他不可能知道其他參與人實(shí)際上會(huì)選擇什么戰(zhàn)略。

33、但是,他能夠正確地預(yù)測(cè)到其他參與人的選擇與其各自的有關(guān)類型之間的關(guān)系。

34、因此,該參與人的決策目標(biāo)就是:在給定自己的類型,以及給定其他參與人的類型與戰(zhàn)略選擇之間關(guān)系的條件下,使得自己的期望效用最大化。

35、貝葉斯納什均衡是一種類型依賴型戰(zhàn)略組合。

36、在給定自己的類型和其他參與人類型的分布概率的條件下,這種戰(zhàn)略組合使得每個(gè)參與人的期望效用達(dá)到了最大化。

37、回到上面提到的市場(chǎng)進(jìn)入的例子。

38、在這個(gè)例子里,對(duì)于挑戰(zhàn)者B來說,原壟斷者A在阻撓成本方面,存在著兩種可能性:高成本或低成本。

39、B不知道A的阻撓成本究竟是高是低,但他知道A在這兩種不同阻撓成本下會(huì)作出的選擇,以及不同阻撓成本(類型)的分布概率。

40、假定高成本的概率為x,則低成本的概率為(1-x)。

41、如果A的阻撓成本高,A將默許B進(jìn)入市場(chǎng);如果A的阻撓成本低,A將阻撓B進(jìn)入市場(chǎng)。

42、在這兩種情況下,如表7-10所示,B進(jìn)入的支付函數(shù)分別是得到40和失去10。

43、因此,B選擇進(jìn)入所得到的期望利潤(rùn)為40x+(-10)(1- x),選擇不進(jìn)入的期望利潤(rùn)為0。

44、簡(jiǎn)單的計(jì)算表明,當(dāng)A阻撓成本高的概率大于20%時(shí),挑戰(zhàn)者B選擇進(jìn)入得到的期望利潤(rùn)大于選擇不進(jìn)入的期望利潤(rùn)。

45、此時(shí),選擇進(jìn)入是B的最優(yōu)選擇。

46、此時(shí)的貝葉斯納什均衡為,挑戰(zhàn)者B選擇進(jìn)入,高成本原壟斷者選擇默許,低成本原壟斷者選擇阻撓。

47、根據(jù)參與者類型的公共知識(shí)獲得參與者行動(dòng)的概率,依此決定下一步策略。

48、第五節(jié) 不完全信息動(dòng)態(tài)博弈在動(dòng)態(tài)博弈中,行動(dòng)有先后次序,后行動(dòng)者可以通過觀察先行動(dòng)者的行為,來獲得有關(guān)先行動(dòng)者的信息,從而證實(shí)或修正自己對(duì)先行動(dòng)者的判斷。

49、如上所述,在不完全信息條件下,博弈的參與人知道其他參與人可能有哪幾種類型,也知道不同的類型與相應(yīng)戰(zhàn)略選擇之間的關(guān)系。

50、但他們并不知道其他參與人的真實(shí)類型。

51、在不完全信息靜態(tài)博弈中,我們是通過海薩尼轉(zhuǎn)換,即通過假定其他參與人知道某一參與人的所屬類型的分布概率,來得出博弈的貝葉斯納什均衡結(jié)果的。

52、而在不完全信息動(dòng)態(tài)博弈中,問題變得更加簡(jiǎn)單。

53、博弈開始時(shí),某一參與人既不知道其他參與人的真實(shí)類型,也不知道其他參與人所屬類型的分布概率。

54、他只是對(duì)這一概率分布有自己的主觀判斷,即有自己的信念。

55、博弈開始后,該參與人將根據(jù)他所觀察到的其他參與人的行為,來修正自己的信念。

56、并根據(jù)這種不斷變化的信念,作出自己的戰(zhàn)略選擇。

57、對(duì)應(yīng)于不完全信息動(dòng)態(tài)博弈的均衡概念是精煉貝葉斯均衡(perfect Bayesian equilibrium)。

58、這個(gè)概念是完全信息動(dòng)態(tài)博弈的子博弈精煉納什均衡與不完全信息靜態(tài)均衡的貝葉斯(納什)均衡的結(jié)合。

59、具體來說,精煉貝葉斯均衡是所有參與人戰(zhàn)略和信念的一種結(jié)合。

60、它滿足如下條件:第一,在給定每個(gè)參與人有關(guān)其他參與人類型的信念的條件下,該參與人的戰(zhàn)略選擇是最優(yōu)的。

61、第二,每個(gè)參與人關(guān)于其他參與人所屬類型的信念,但是使用貝葉斯法則從所觀察到的行為中獲得的。

62、貝葉斯法則是概率統(tǒng)計(jì)中的應(yīng)用所觀察到的現(xiàn)象對(duì)有關(guān)概率分布的主觀判斷(即先驗(yàn)概率)進(jìn)行修正的標(biāo)準(zhǔn)方法。

63、采用上一節(jié)的例子,可以將貝葉斯規(guī)則的分析思路表達(dá)如下。

64、挑戰(zhàn)者B不知道原壟斷者A是屬于高阻撓成本類型還是低阻撓成本類型,但B知道,如果A屬于高阻撓成本類型,B進(jìn)入市場(chǎng)時(shí)A進(jìn)行阻撓的概率是20%(此時(shí)A為了保持壟斷帶來的高利潤(rùn),不計(jì)成本地拼命阻撓);如果A屬于低阻撓成本類型,B進(jìn)入市場(chǎng)時(shí)A進(jìn)行阻撓的概率是100%。

65、博弈開始時(shí),B認(rèn)為A屬于高阻撓成本企業(yè)的概率為70%,因此,B估計(jì)自己在進(jìn)入市場(chǎng)時(shí),受到A阻撓的概率為:0.7×0.2+0.3×1=0.440.44是在B給定A所屬類型的先驗(yàn)概率下,A可能采取阻撓行為的概率。

66、當(dāng)B進(jìn)入市場(chǎng)時(shí),A確實(shí)進(jìn)行阻撓。

67、使用貝葉斯法則,根據(jù)阻撓這一可以觀察到的行為,B認(rèn)為A屬于高阻撓成本企業(yè)的概率變成A屬于高成本企業(yè)的概率=0.7(A屬于高成本企業(yè)的先驗(yàn)概率)×0.2(高成本企業(yè)對(duì)新進(jìn)入市場(chǎng)的企業(yè)進(jìn)行阻撓的概率)÷0.44=0.32根據(jù)這一新的概率,B估計(jì)自己在進(jìn)入市場(chǎng)時(shí),受到A阻撓的概率為:0.32×0.2+0.68×1=0.744如果B再一次進(jìn)入市場(chǎng)時(shí),A又進(jìn)行了阻撓。

68、使用貝葉斯法則,根據(jù)再次阻撓這一可觀察到的行為,B認(rèn)為A屬于高阻撓成本企業(yè)的概率變成A屬于高成本企業(yè)的概率=0.32(A屬于高成本企業(yè)的先驗(yàn)概率)×0.2(高成本企業(yè)對(duì)新進(jìn)入市場(chǎng)的企業(yè)進(jìn)行阻撓的概率)÷0.744=0.086這樣,根據(jù)A一次又一次的阻撓行為,B對(duì)A所屬類型的判斷逐步發(fā)生變化,越來越傾向于將A判斷為低阻撓成本企業(yè)了。

69、以上例子表明,在不完全信息動(dòng)態(tài)博弈中,參與人所采取的行為具有傳遞信息的作用。

70、盡管A企業(yè)有可能是高成本企業(yè),但A企業(yè)連續(xù)進(jìn)行的市場(chǎng)進(jìn)入阻撓,給B企業(yè)以A企業(yè)是低阻撓成本企業(yè)的印象,從而使得B企業(yè)停止了進(jìn)入地市場(chǎng)的行動(dòng)。

71、應(yīng)該指出的是,傳遞信息的行為是需要成本的。

72、假如這種行為沒有成本,誰都可以效仿,那么,這種行為就達(dá)不到傳遞信息的目的。

73、只有在行為需要相當(dāng)大的成本,因而別人不敢輕易效仿時(shí),這種行為才能起到傳遞信息的作用。

74、傳遞信息所支付的成本是由信息的不完全性造成的。

75、但不能因此就說不完全信息就一定是壞事。

76、研究表明,在重復(fù)次數(shù)有限的囚徒困境博弈中,不完全信息可以導(dǎo)致博弈雙方的合作。

77、理由是:當(dāng)信息不完全時(shí),參與人為了獲得合作帶來的長(zhǎng)期利益,不愿過早暴露自己的本性。

78、這就是說,在一種長(zhǎng)期的關(guān)系中,一個(gè)人干好事還是干壞事,常常不取決于他的本性是好是壞,而在很大程度上取決于其他人在多大程度上認(rèn)為他是好人。

79、如果其他人不知道自己的真實(shí)面目,一個(gè)壞人也會(huì)為了掩蓋自己而在相當(dāng)長(zhǎng)的時(shí)期內(nèi)做好事。

80、根據(jù)參與者類型的公共知識(shí)以及參與者歷史行為來獲得參與者行動(dòng)的概率,依此決定下一步策略。

81、這是一種均衡的計(jì)算方法。

本文到此分享完畢,希望對(duì)大家有所幫助。

關(guān)鍵詞: