制服?亚洲?国产,免看一级a一片

1、貝葉斯納什均衡是指這樣一組策略組合：在給定自己的特征和其他局中人特征的概率分布的情況下，每個(gè)局中人選擇策略使自己的期望支付達(dá)到最大化，也就是說，沒有人有積極性選擇其他策略。

2、動(dòng)態(tài)博弈戰(zhàn)略行動(dòng)在動(dòng)態(tài)博弈中，參與人為了使得其他參與人的選擇對(duì)自己有利，往往采取一些行動(dòng)來影響其他參與人對(duì)于自己行為的預(yù)期。

【資料圖】

3、這些行為稱為戰(zhàn)略行動(dòng)(strategic move)。

4、1.首先行動(dòng)優(yōu)勢(shì)首先行動(dòng)優(yōu)勢(shì)(first-mover advantage)是指，在博弈中首先作出戰(zhàn)略選擇并采取相應(yīng)行動(dòng)的參與人可以獲得較多的利益。

5、2.確實(shí)可信的威脅確實(shí)可信的威脅(credible threat)是指，博弈的參與人通過某種行動(dòng)改變自己的支付函數(shù)，從而使得自己的威脅顯得可信。

6、參與人為改變博弈結(jié)果而采取的措施稱為承諾(commitment)。

7、第四節(jié) 不完全信息靜態(tài)博弈在許多情況下，參與人對(duì)對(duì)手的了解往往是不夠精確的。

8、這種情況下的博弈就是不完全信息博弈。

9、舉例來說，某一市場(chǎng)原來被A企業(yè)所壟斷。

10、現(xiàn)在B企業(yè)考慮是否進(jìn)入。

11、B企業(yè)知道，A企業(yè)是否允許它進(jìn)入，取決于A企業(yè)阻撓B企業(yè)進(jìn)入所花費(fèi)的成本。

12、如果阻撓的成本低，那么，正如表7-10后兩列所表示的，A企業(yè)的占優(yōu)戰(zhàn)略是阻撓，博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡――A阻撓，B不進(jìn)入。

13、如果阻撓的成本高，那么，正如表7-10前兩列所表示的，A企業(yè)的占優(yōu)戰(zhàn)略是默許B進(jìn)入，博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡――A默許，B進(jìn)入。

14、B企業(yè)所不知道的，是A企業(yè)的阻撓成本是高是低。

15、這里，某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。

16、某一參與人所擁有的全部私人信息稱為他的類型。

17、在上述例子中，阻撓成本就是 A的私人信息。

18、高阻撓成本和低阻撓成本則是兩種不同的類型。

19、顯然，在這里，B所遇到的，是不確定性條件下的選擇問題。

20、因?yàn)锽不僅不知道A的類型（是高還是低），而且不知道不同類型的分布概率。

21、解決這類問題的方法之一，就是把不確定性條件下的選擇轉(zhuǎn)換為風(fēng)險(xiǎn)條件下的選擇。

22、在風(fēng)險(xiǎn)條件下，B雖然不知道A的類型，但可以知道不同類型的分布概率。

23、將不確定性條件下的選擇轉(zhuǎn)換為風(fēng)險(xiǎn)條件下的選擇，稱為海薩尼轉(zhuǎn)換(the Harsanyi transformation)。

24、按照海薩尼的方法，所有參與人的真實(shí)類型都是給定的。

25、其他參與人雖然不清楚某一參與人的真實(shí)類型，但知道這些可能出現(xiàn)的類型的分布概率，而且這種概率是公共知識(shí)。

26、用上例來說，公共知識(shí)不僅意味著B企業(yè)知道A企業(yè)高阻撓成本與低阻撓成本的分布概率，而且意味著A也清楚B知道這一概率。

27、通過海薩尼轉(zhuǎn)換，不完全信息博弈變成了完全但不完美信息博弈(games of complete but imperfect information)。

28、這里的不完美信息，就是指其他參與人只知道某一參與人某些方面類型的分布概率，而不知道該參與人在這些方面的真實(shí)類型。

29、在上述轉(zhuǎn)換的基礎(chǔ)上，海薩尼提出了貝葉斯納什均衡(Bayesian Nash equilibrium)。

30、對(duì)此，可以作如下解釋：在不完全信息靜態(tài)博弈中，參與人同時(shí)行動(dòng)，沒有機(jī)會(huì)觀察到別人的選擇。

31、給定其他參與人的戰(zhàn)略選擇，每個(gè)參與人的最優(yōu)戰(zhàn)略依賴于自己的類型。

32、由于每個(gè)參與人僅知道其他參與人有關(guān)類型的分布概率，而不知道其真實(shí)類型，因而，他不可能知道其他參與人實(shí)際上會(huì)選擇什么戰(zhàn)略。

33、但是，他能夠正確地預(yù)測(cè)到其他參與人的選擇與其各自的有關(guān)類型之間的關(guān)系。

34、因此，該參與人的決策目標(biāo)就是：在給定自己的類型，以及給定其他參與人的類型與戰(zhàn)略選擇之間關(guān)系的條件下，使得自己的期望效用最大化。

35、貝葉斯納什均衡是一種類型依賴型戰(zhàn)略組合。

36、在給定自己的類型和其他參與人類型的分布概率的條件下，這種戰(zhàn)略組合使得每個(gè)參與人的期望效用達(dá)到了最大化。

37、回到上面提到的市場(chǎng)進(jìn)入的例子。

38、在這個(gè)例子里，對(duì)于挑戰(zhàn)者B來說，原壟斷者A在阻撓成本方面，存在著兩種可能性：高成本或低成本。

39、B不知道A的阻撓成本究竟是高是低，但他知道A在這兩種不同阻撓成本下會(huì)作出的選擇，以及不同阻撓成本（類型）的分布概率。

40、假定高成本的概率為x，則低成本的概率為(1-x)。

41、如果A的阻撓成本高，A將默許B進(jìn)入市場(chǎng)；如果A的阻撓成本低，A將阻撓B進(jìn)入市場(chǎng)。

42、在這兩種情況下，如表7-10所示，B進(jìn)入的支付函數(shù)分別是得到40和失去10。

43、因此，B選擇進(jìn)入所得到的期望利潤(rùn)為40x+(-10)(1- x)，選擇不進(jìn)入的期望利潤(rùn)為0。

44、簡(jiǎn)單的計(jì)算表明，當(dāng)A阻撓成本高的概率大于20%時(shí)，挑戰(zhàn)者B選擇進(jìn)入得到的期望利潤(rùn)大于選擇不進(jìn)入的期望利潤(rùn)。

45、此時(shí)，選擇進(jìn)入是B的最優(yōu)選擇。

46、此時(shí)的貝葉斯納什均衡為，挑戰(zhàn)者B選擇進(jìn)入，高成本原壟斷者選擇默許，低成本原壟斷者選擇阻撓。

47、根據(jù)參與者類型的公共知識(shí)獲得參與者行動(dòng)的概率，依此決定下一步策略。

48、第五節(jié) 不完全信息動(dòng)態(tài)博弈在動(dòng)態(tài)博弈中，行動(dòng)有先后次序，后行動(dòng)者可以通過觀察先行動(dòng)者的行為，來獲得有關(guān)先行動(dòng)者的信息，從而證實(shí)或修正自己對(duì)先行動(dòng)者的判斷。

49、如上所述，在不完全信息條件下，博弈的參與人知道其他參與人可能有哪幾種類型，也知道不同的類型與相應(yīng)戰(zhàn)略選擇之間的關(guān)系。

50、但他們并不知道其他參與人的真實(shí)類型。

51、在不完全信息靜態(tài)博弈中，我們是通過海薩尼轉(zhuǎn)換，即通過假定其他參與人知道某一參與人的所屬類型的分布概率，來得出博弈的貝葉斯納什均衡結(jié)果的。

52、而在不完全信息動(dòng)態(tài)博弈中，問題變得更加簡(jiǎn)單。

53、博弈開始時(shí)，某一參與人既不知道其他參與人的真實(shí)類型，也不知道其他參與人所屬類型的分布概率。

54、他只是對(duì)這一概率分布有自己的主觀判斷，即有自己的信念。

55、博弈開始后，該參與人將根據(jù)他所觀察到的其他參與人的行為，來修正自己的信念。

56、并根據(jù)這種不斷變化的信念，作出自己的戰(zhàn)略選擇。

57、對(duì)應(yīng)于不完全信息動(dòng)態(tài)博弈的均衡概念是精煉貝葉斯均衡(perfect Bayesian equilibrium)。

58、這個(gè)概念是完全信息動(dòng)態(tài)博弈的子博弈精煉納什均衡與不完全信息靜態(tài)均衡的貝葉斯（納什）均衡的結(jié)合。

59、具體來說，精煉貝葉斯均衡是所有參與人戰(zhàn)略和信念的一種結(jié)合。

60、它滿足如下條件：第一，在給定每個(gè)參與人有關(guān)其他參與人類型的信念的條件下，該參與人的戰(zhàn)略選擇是最優(yōu)的。

61、第二，每個(gè)參與人關(guān)于其他參與人所屬類型的信念，但是使用貝葉斯法則從所觀察到的行為中獲得的。

62、貝葉斯法則是概率統(tǒng)計(jì)中的應(yīng)用所觀察到的現(xiàn)象對(duì)有關(guān)概率分布的主觀判斷（即先驗(yàn)概率）進(jìn)行修正的標(biāo)準(zhǔn)方法。

63、采用上一節(jié)的例子，可以將貝葉斯規(guī)則的分析思路表達(dá)如下。

64、挑戰(zhàn)者B不知道原壟斷者A是屬于高阻撓成本類型還是低阻撓成本類型，但B知道，如果A屬于高阻撓成本類型，B進(jìn)入市場(chǎng)時(shí)A進(jìn)行阻撓的概率是20%（此時(shí)A為了保持壟斷帶來的高利潤(rùn)，不計(jì)成本地拼命阻撓）；如果A屬于低阻撓成本類型，B進(jìn)入市場(chǎng)時(shí)A進(jìn)行阻撓的概率是100%。

65、博弈開始時(shí)，B認(rèn)為A屬于高阻撓成本企業(yè)的概率為70%，因此，B估計(jì)自己在進(jìn)入市場(chǎng)時(shí)，受到A阻撓的概率為：0.7×0.2+0.3×1=0.440.44是在B給定A所屬類型的先驗(yàn)概率下，A可能采取阻撓行為的概率。

66、當(dāng)B進(jìn)入市場(chǎng)時(shí)，A確實(shí)進(jìn)行阻撓。

67、使用貝葉斯法則，根據(jù)阻撓這一可以觀察到的行為，B認(rèn)為A屬于高阻撓成本企業(yè)的概率變成A屬于高成本企業(yè)的概率=0.7（A屬于高成本企業(yè)的先驗(yàn)概率）×0.2（高成本企業(yè)對(duì)新進(jìn)入市場(chǎng)的企業(yè)進(jìn)行阻撓的概率）÷0.44=0.32根據(jù)這一新的概率，B估計(jì)自己在進(jìn)入市場(chǎng)時(shí)，受到A阻撓的概率為：0.32×0.2+0.68×1=0.744如果B再一次進(jìn)入市場(chǎng)時(shí)，A又進(jìn)行了阻撓。

68、使用貝葉斯法則，根據(jù)再次阻撓這一可觀察到的行為，B認(rèn)為A屬于高阻撓成本企業(yè)的概率變成A屬于高成本企業(yè)的概率=0.32（A屬于高成本企業(yè)的先驗(yàn)概率）×0.2（高成本企業(yè)對(duì)新進(jìn)入市場(chǎng)的企業(yè)進(jìn)行阻撓的概率）÷0.744=0.086這樣，根據(jù)A一次又一次的阻撓行為，B對(duì)A所屬類型的判斷逐步發(fā)生變化，越來越傾向于將A判斷為低阻撓成本企業(yè)了。

69、以上例子表明，在不完全信息動(dòng)態(tài)博弈中，參與人所采取的行為具有傳遞信息的作用。

70、盡管A企業(yè)有可能是高成本企業(yè)，但A企業(yè)連續(xù)進(jìn)行的市場(chǎng)進(jìn)入阻撓，給B企業(yè)以A企業(yè)是低阻撓成本企業(yè)的印象，從而使得B企業(yè)停止了進(jìn)入地市場(chǎng)的行動(dòng)。

71、應(yīng)該指出的是，傳遞信息的行為是需要成本的。

72、假如這種行為沒有成本，誰都可以效仿，那么，這種行為就達(dá)不到傳遞信息的目的。

73、只有在行為需要相當(dāng)大的成本，因而別人不敢輕易效仿時(shí)，這種行為才能起到傳遞信息的作用。

74、傳遞信息所支付的成本是由信息的不完全性造成的。

75、但不能因此就說不完全信息就一定是壞事。

76、研究表明，在重復(fù)次數(shù)有限的囚徒困境博弈中，不完全信息可以導(dǎo)致博弈雙方的合作。

77、理由是：當(dāng)信息不完全時(shí)，參與人為了獲得合作帶來的長(zhǎng)期利益，不愿過早暴露自己的本性。

78、這就是說，在一種長(zhǎng)期的關(guān)系中，一個(gè)人干好事還是干壞事，常常不取決于他的本性是好是壞，而在很大程度上取決于其他人在多大程度上認(rèn)為他是好人。

79、如果其他人不知道自己的真實(shí)面目，一個(gè)壞人也會(huì)為了掩蓋自己而在相當(dāng)長(zhǎng)的時(shí)期內(nèi)做好事。

80、根據(jù)參與者類型的公共知識(shí)以及參與者歷史行為來獲得參與者行動(dòng)的概率，依此決定下一步策略。

81、這是一種均衡的計(jì)算方法。

本文到此分享完畢，希望對(duì)大家有所幫助。

關(guān)鍵詞：

久久精品色妇熟妇丰满人妻99,久久久网,和少妇疯狂做爰过程,欧美系列亚洲系列国产系列

廊坊生活網(wǎng)> 要聞

貝葉斯納什均衡例題_貝葉斯納什均衡每日聚焦

相關(guān)推薦

熱點(diǎn)

要聞

久久精品色妇熟妇丰满人妻99,久久久网,和少妇疯狂做爰过程,欧美系列亚洲系列国产系列

廊坊生活網(wǎng)> 要聞

貝葉斯納什均衡例題_貝葉斯納什均衡 每日聚焦

相關(guān)推薦

熱點(diǎn)

要聞

貝葉斯納什均衡例題_貝葉斯納什均衡每日聚焦