您好,欢迎来到花图问答。
搜索
您的当前位置:首页混合战略纳什均衡及应用

混合战略纳什均衡及应用

来源:花图问答
混合战略纳什均衡及应用理论研讨

混合战略纳什均衡及应用

文/陈晓东

摘要:博弈论是运筹学的一个重要分支,类型众多。其中,非合作博弈是现代博弈理论中的核心内容和重要基础。本文在简要介绍了博弈论相关内容的基础上,重点介绍了非合作博弈中最重要、最核心的部分即Nash均衡。在此基础上,以纳什均衡作为理论支撑点,结合得意矩阵分析解决了经济生活中的一些实际问题。例如治理污水排放的制度设计问题。

关键词:博弈论;均衡点;得益矩阵;纳什均衡

博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。非合作博弈是现代博弈理论中的核心内容和重要基础,而Nash均衡则是非合作博弈的核心部分。要用博弈论解决现实经济生活中的决策问题,其关键在于如何根据行为中的支付矩阵得出纳什平衡点,通过分析决策者的心理活动来得到博弈模型,从而依据模型来针对生活中的实际问题制定相关的政策以预防不良现象的发生。

表1 父母与儿子的得益矩阵

儿子找工作在家(4,2)(0,3)父母资助不资助(0,2)(1,1)的最优战略是寻找工作;而给定儿子寻找工作,父母的最优战略是资助。

该博弈的显著特征是每个参与人都不能猜出对方的战略。参与人是以一定的概率选择某种战略,故称这样的战略为混合战略。

在该博弈中,设想父母以的概率选择资助,的概率选择不资助。那么,对儿子来说,选择寻找工作带来的期望效用为,选择在家带来的期望效用同样为。可见,选择任何混合战略带来的期望效用都是相同的。因此,儿子的任何一种战略都是对父母所选择的混合战略的最优反应。

一、非合作博弈

一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”。在该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念——“纳什均衡”。

在博弈论里,有各种各样的均衡概念。混合战略均衡是纳什均衡的一种,混合战略概念使博弈论的研究范围更加广泛。混合战略纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此将着重介绍混合战略纳什均衡的定义。

定义1:在个参与人博弈的战略表述式G={S1,…,Sn;u1,…,un}中,假定参与i人有k个纯战略:Si={sil,…,sik},那么,概率分布σi=(σil,…,σik)称为i的一个混合战略,这里σik=σ(sik)是i选择sik的概率,对于所有的k,0≤σik≤1∑k1σik=1。

混合战略纳什均衡的求解,通常可以采用得益矩阵表示出在不同策略下各博弈方的效益。来看一看这样一个问题:懒惰的儿子失业在家,父母有两个战略:资助或不资助;相应儿子也有两个战略:寻找工作或在家。父母想帮助儿子,但是前提是后者必须试图找工作,否则不予帮助;而儿子认为只有在得到父母资助时才会去寻找工作。表1给出了该博弈的得益矩阵:

显然,给定父母资助,儿子的最优战略是在家;给定儿子在家;父母的最优战略是不资助,给定父母不救济,儿子

二、治理污水排放的博弈分析

随着重庆永川区经济的飞速发展,以前河水清澈的临江河,现在却受到了一定的工业污染。企业排污既损害了人民的健康,又损害了国家的利益。虽然政府已经意识到了问题的严重性,正在加强环保方面的管理,但是如何才能在实施治理污染的过程中与污染源之间进行合理、高效博弈是我们要分析的重点。

治理污水排放是合理合法的,但是,对治理污水排放的企业而言,必然在此过程中需要增加生产成本,因此作为一个以追求利润最大为目标的企业来说,都在尽可能想方设法不增加生产成本,而采取直接排污的方法。政府作为国家的代理人,检查、制止排污是理所当然的职责。故政府和企业之间必然存在一种博弈所具备的一切条件,于是博弈产生了。

这个博弈的参与人包括政府和企业,政府的战略选择是检查和不检查,企业的战略选择是排污或不排污。不妨作如下假设:

802008 .4混合战略纳什均衡及应用

理论研讨

(1)T是企业向政府缴纳的固定金额。

(2)W是政府对企业排污所收取的罚款金额,为罚款率。(3)F是政府检查成本。(4)Y为企业的实际收入。

(5)C为企业排污时,如果政府检查,企业所具有的心理成本。

(6)G是企业排污所造成的污染而对社会利益的损害。由此可得企业和政府对应不同战略组合的得益矩阵(见表2):

表2 政府和企业的得益矩阵   排污    不排污政府 企业检查  (T+W-F,Y-T-W-C) (T-F,Y-T)不检查     (T-G,Y-T+G)  (T,Y-T)令E2(1,P)=E2(0,P),得P*=F/(W+G),即:当p>p*时,政府的最优选择将是检查;当Q<Q*时,政府的最优选择将是不检查;当Q=Q*时,政府可随机的选择检查和不检查。这里的最终目标是降低企业的排污概率,达到环境保护的目的。这样不仅可以降低污水对环境的污染,而且还可以降低政府行政费用支出。根据的结果,可以采取两种举措:

(1)增大分母,采取重罚措施,使企业不敢轻易铤而走险。(2)减小分子,降低成本,现阶段可以采取设立热线电话或建立投诉网站等这样一些比较行之有效的办法,这样可避免政府盲目出击检查,做到有的放矢。

换言之还可理解为,对排污的惩罚越重,企业因排污所获得的生产成本越少,企业的排污概率就越小。反过来,企业因排污所获得的生产成本就越多,企业的排污概率就越大。

实际上,企业因排污所获得的生产成本大小,政府是难以精确把握的。以上所讨论的企业都是以利润最大化为目的企业,这适用于民营企业的情况。但现实情况是,排污屡教不改者,大多数是以乡镇企业为代表的集体所有制企业和部分小型国有企业,这里就牵涉到一个企业经营的控制权收益问题。

政府在治理企业排污的时候,应设法考虑收益权的收益问题。由于国民待遇的要求,不可能因企业性质不同而采取不同的罚款数量。所以解决这个问题的办法,只能采用行政手段,这样可更好地达到治污目的。同时也要注意地方政府在治理污水中的角色。首先,地方政府的行为要受制于中央政府既定的制度,具体地说就是需要全面贯彻中央的法律、法规,从而规范地方政府的行为。其次,地方政府亦可亲自组织创新或担当其制度创新的重任。最后,地方政府是制度的执行维护者,对违法排污者实施重法。

            作者单位:重庆文理学院数计系

在上述假设条件下,不存在纯战略纳什均衡,因为参与者都只能以一定的概率选择某种战略,因此只有求解混合战略纳什均衡。反之,如果假定条件不成立,通过劣战略剔除可得到占优战略,即(检查、不排污)或(不检查、排污)为占优均衡。

给定政府检查的概率Q,企业选择排污(P=1)和不排污(P=0)的期望收益分别为:

EP(Q,1)=(Y-T-W-C)Q+[Y-(T-G)](1-Q)EP(Q,0)=Q(Y-T)+(1-Q)(Y-T)

如果政府检查和不检查的预期收益相等,则可求解企业选择排污的可能性。

令E1(Q,1)=E1(Q,0)得Q*=G/[(1+n)G+C],即:当时Q>Q*,企业的最优选择将是不排污;当时Q<Q*,企业的最优选择将是排污;当时Q=Q*,企业可随机的选择排污和不排污。给定企业排污的概率P,政府选择检查(Q=1)和不检查(P=0)的预期收益期为:

EP(1,P)=(Y+W-F)P+(T-F)(1-P)EQ(0,P)=P(T-G)+(1-P)T

如果企业排污和不排污的预期收益相等,则可求解政府选择检查的概率。

参考文献:

[1]谢识予.纳什均衡论[M].上海:上海财经大学出版社,1999.[2]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.[3]孙恩棣.生活中的博弈论[M].北京:京华出版社,1992.[4]韩松译.博弈论经典[M].北京:中国人民大学出版社,1996.

2008 .4

81

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuowenda.com 版权所有 湘ICP备2023022495号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务