新常态下如何实现环境保护的纳什均衡

23.02.2016  12:19

  基金项目:环保公益性行业科研专项(201309068)

  作者:焦若静,牛海鹏

  摘要从自然资源和生态环境的公共性出发,认为以经济建设为中心的政策选择,促成了以淡视生态环境为前提的均衡策略,让经济发展与环境保护之间形成“”的纳什均衡,而新常态能够为经济发展和环境保护之间达成好的纳什均衡提供了改革保障、法制保障和经济保障,因此,新常态下的生态文明建设能够解套环境保护的“囚徒困境”,最重要的任务是借助政府这一外力制定新的“游戏规则”,以打破原有的“纳什均衡”,通过建立健全环境成本内部化的政策措施和生态补偿机制、改革政绩考核机制实现对绿色发展的激励等措施,推进经济发展与环境保护之间达成理想的“纳什均衡”。

  

  

  无论是人口和贫困给环境带来的压力,还是大规模工业生产带来的污染与生态破坏,都与人们对自身利益的追求和对外部性效果的淡视密不可分。自然环境和生态资源表现出公共物品的属性,因为其没有明确的权属和成本,人们在追求经济利益最大化的过程中不计代价和后果的使用环境资源,而把本应由自己支付的成本转嫁给社会。可以说,这是引发各种环境问题的人为、主观原因。

  环境保护涉及到多个主体之间的博弈,包括排污企业之间的博弈、地方政府与排污企业之间的博弈、地方政府与地方政府之间的越界博弈、中央政府与地方政府之间的博弈,以及个体与企业、政府的博弈。这些博弈的结果是相互联系、互相影响的,共同决定了环境保护的绩效。

  改革开放以来,我国经济社会发展的重心是一切以经济建设为中心,大力推进工业化与现代化。在这一宏观战略思想的指引下,各地方、政府和企业逐渐形成了以淡视生态环境为前提的均衡策略,也正是这种多主体的博弈使得以往的经济发展与环境保护之间形成“”的纳什均衡,陷入多维度、多层次的“囚徒困境”,中国为此付出了巨大的生态环境代价。面对中国经济增速下滑,过去三十多年快速增长积累的风险的凸显和释放,以及人口、资源、环境红利等基本面的悄然变换,中国经济出现了不同于以往的特征。2014年5月,习近平总书记在河南考察时首次提及“新常态”,新常态深刻揭示了我国经济发展阶段的新变化、新特点,指出中国的经济发展要摆脱以环境污染和环境破坏为代价的“旧常态”。新常态的一个突出特征是资源环境约束推动形成绿色低碳循环发展新方式:过去,能源资源和生态环境空间相对较大,而现在环境承载能力已经达到或接近上限,必须顺应人民群众对良好生态环境的期待,推动形成绿色低碳循环发展新方式。新常态的提出标志着我国可持续发展战略的重大转向,环境保护与经济增长的战略重要性发生了逆转。无疑,这将打破各地方、政府和企业形成多年的惯性模式,在新的战略导向下通过博弈重新建立环境保护的纳什均衡。那么,新常态下各主体间的利益将发生哪些变化,如何通过环境管理政策协调各个决策主体之间的利益关系,从而更加科学、有效地推动环境保护、促进社会可持续发展?本文试图利用博弈论的相关理论,对环境保护过程中各个决策主体的博弈与均衡进行分析,对此提供新的探索与借鉴。

   1 新常态下经济发展与环境保护的辩证统一  

  经济发展与环境保护是新常态下中国的发展进程中必须守住的两条底线。其一,经济发展是解决中国所有问题的总钥匙。不发展,居民收入无法增加,生活水平无法提高,深化改革缺乏力度,调整结构缺乏支撑。其二,生态环境是保障中国解决所有问题的总后盾。生态环境差,经济发展难以维持,人类发展难以维系,社会发展难以为继。尽管经济发展与环境保护是一对相互矛盾的目标,但是两条底线具有重要的内在联系,如何实现它们的辩证统一,而非顾此失彼,是智慧的考验。

  第一,守住经济发展的底线,将对环境保护起到重要的推动和促进作用。经济发展不仅有利于推动资源利用和环保科学技术的进步,而且可为环保工作提供充足的资金支持与保障。此外,经济发展水平的提高会带来人们需求层次的提升。随着收入增加和生活质量的提高,人们改善生活环境的意愿正越来越强,对环境保护的关注度正越来越高。因此,不要发展的保护环境是削足适履,忽视发展而盲目固守生态底线是因噎废食。

  第二,守住生态环境的底线,才能为经济的可持续发展创造必须的支撑条件。人类的发展的历史表明,大规模的工业化进程可能对自然环境造成不可逆转的破坏,忽视环境保护的短视行为会引发长期的环境问题和远期的高额治理费用,而积极的环境保护将减少经济发展的长期成本。不仅如此,有效的环境保护还可以为发展提供可持续的资源供给。水、森林、矿产、生物等资源是工业生产和社会经济赖以运转的基本要素,只有合理地开发和利用环境资源,人类才能够长久、可持续地享有大自然带来的恩惠,因此,环境保护和经济发展两者既相互制约又相互促进,离开经济发展抓环境保护是“缘木求鱼”,脱离环境保护搞经济发展是“竭泽而渔

  我们同时要守住发展和生态两条底线,既要让人们公平地享受发展成果,又要让人们自由地呼吸清洁空气,也就是新常态所指出的,经济发展慢一点、环境保护快一点,留住更多的青山绿水、创造适当的金山银山。那么环境管理怎样适应这些要求,使环境保护实现由低水平均衡向高水平均衡的转变,便成为一个重要的问题。

   2 环境保护中的主要博弈类型  

  博弈论是研究决策主体在理性决策条件下的冲突与合作的理论。与传统微观经济学的理性人决策相比,博弈论考虑了各个决策主体之间的相互影响,每个主体的决策都是以相互外部性为前提的理性人选择问题。博弈论由三个基本要素构成:参与者、决策集和利益。参与者即决策的主体,在博弈中,决策主体是理性的,他们进行最优选择以确保自己的利益最大化。决策集是指参与者进行的所有可能的策略的集合。利益是指决策者确定各自策略后可以得到的相应的收益。假设有n个人参与博弈,给定其他人策略的条件下,每个局中人选择自己效用最大化的最优策略,所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是由所有参与人最优策略组成这种策略组合,即博弈的解,即在给定别人策略的情况下,没人有足够理由打破这种均衡。但是,如果决策者的最佳选择并没有导致整体的最佳选择,便会由于“理性的无知”陷入博弈论中所谓的“囚徒困境”。

  决策主体的选择会对环境保护产生不同的结果,从而影响经济发展。在参与环境保护活动的过程中,居民、企业、政府、地方等决策主体的利益往往相互影响、相互制约,他们不仅会考虑自己的利益和成本,同样也会考虑其他决策主体的利益和成本,决策主体间的博弈随之产生。

  第一,排污企业之间的博弈。排污企业对环境保护有两种选择,保护或不保护:保护环境可以获得正常水平的盈利,而不保护环境则可以减少成本,增加收益。显而易见,排污企业不会考虑其他企业的决策,一定会选择收益较高的不保护环境。即使选择不保护将面临污染后的处罚,只要处罚所担负的成本小于企业治污所需的成本,污染企业都会选择不保护。于是,企业间形成了一个都不愿承担保护责任的纳什均衡。但是我们应该看到,每个企业所选择的不保护策略是建立在环境负效益基础上的,本应由企业承担的成本由整个社会来承担了。作为一个理性的生产者,只污染不治理虽然不是社会最优状态,却是个体的最优决策,没有一个排污企业愿意改变它的状态。可见,在完全市场条件下,由于企业不保护环境而带来的污染是不可避免的,企业的最优选择策略实际上是一个“囚徒困境”。

  第二,居民之间的博弈。居民个体在面对环境污染时也同样有两种决策:听之任之或主动防治。当其他居民破坏环境时,无论是自己行动起来还是采取上诉、举报等措施都需要一定的成本,但是对于每一个人来说,不论其采取单独的防治措施,或联合对方采取防治措施,环境得到治理获得的总收益总是被很多人共享,其所分得的利益势必小于单独行动的成本。因此,不管其他居民采取哪种行动,自己的最优选择均是不参与主动防治。因此,依旧会出现“囚徒困境”。

  第三,地方政府之间的博弈。环境污染会通过水流和大气扩散到周围地区,并不局限于污染源所在的行政单位。面对本地的污染影响了周边地区的情况,地方政府的决策行为与居民之间的决策行为较为类似。第一种选择是“睁一只眼闭一只眼”,受政绩和短期利益的影响,地方政府会将管理重心放在经济的发展和GDP的提升方面,而忽略环境保护;第二种选择是投入资金与精力进行环境保护与管理,这种选择见效慢,本地收益小。地方政府深知,如果自己加强环保监管力度,企业减少污染排放,有利于整个区域的持续发展。但是,如果仅仅自己加强环境监管,而其他地方政府并没有这样做,自己的利益就会受到损害。环境监管提升了本地企业的生产成本,与其他地方的企业相比丧失市场优势,有的企业甚至会用搬迁来规避环境规制。这无疑会减少地方政府吸引的投资和税收,这对以经济增长作为官员政绩考核标准的地方官员来说,是无法接受的。因此,作为一个理性的地方政府,不作为虽然不是最理性的,却是最优的决策,没人愿意改变不作为的状态,这便使地方政府陷入“囚徒困境”。以长江经济带为例,由于生态保护的成本完全由上游承担,生态保护的收益却由上下游共同分享。因此,上游地区缺乏保护环境的动力。而且,地方政府与中央政府的不同利益诉求以及地方政府之间的竞争诱发并加剧了区域性的环境利益冲突。

  第四,污染企业与居民之间的博弈。污染企业有治理和不治理两种选择。当其选择不治理时,其收益为P1;当选择治理时,其收益为P2;显然,P1>P2。对于居民来说,有参与环境保护和不参与环境保护两种选择,如果参与保护会得到收益W/n,但是会付出成本C;如果不参与保护,会有一定损失,但一定会小于参与环境保护付出的成本。对于两个博弈主体来说,最优选择都是不治理。

  第五,污染企业与政府之间的博弈。从以上几个博弈主体之间的关系可以看出,如果没有强制性的管理,不论是居民、污染企业或是污染企业之间,其对环境保护的态度都是不保护或不作为。这也证明了环境保护需要强有力的政府干预和政策法规规定,从而通过改变博弈双方的利益而实现纳什均衡。企业生产所带来的环境污染这一负外部性问题一直是经济学中的难题,甚至可以说,只有依靠政府才能解决好这一问题。对于政府来说,治理环境是最优的选择;污染企业的最有选择则是不治理环境。在这一过程中,政府通过制定环境政策法规、出台相应的惩罚措施对污染企业进行监督和管理。但是,在双方博弈的过程中,极易出现信息的不对称,即“上有政策下有对策”的情况。污染企业对其治理环境的执行较为清楚,但政府则难以计量短期内的环境改善情况。在这一情况下,“严惩与重罚”成为左右污染企业决策的关键。如果污染企业选择不治理或逃避治理后,其受到严惩和重罚的概率成本高于其治理成本,那么污染企业就会选择进行治理;反之则会逃避治理,使环境向着恶性方向不断发展。

  污染企业与政府之间的博弈关系在理论上较为简单,但是在实施过程中则变得较为复杂,这其中的关键的在于地方政府所扮演的角色,主要是环境保护和经济发展的协调和融合所致。由于我国实行的是五级行政管理体系,公共权力与责任的“委托—代理”关系链太长,很容易出现信息传递失真和中央政府与地方政府之间信息不对称的情况。在这种情况下,地方政府在环境管理过程中获得了较大的选择空间。如果地方政府的干部绩效考核以GDP为主要导向,为了在有限任期内尽快做出成绩,取得上级认可从而赢得政治前途,他们就会把精力集中于具有短平快特点的经济发展上,而忽视环境保护这类短期内难以获得投资回报的工作。

   3 新常态下的生态文明制度建设解套环境保护的“囚徒困境  

  新常态下,经济增长速度的下整改变了诸多博弈主体的利益。首先改变的是中央政府对经济增长的预期,中央政府会根据自己的目标函数调整官员晋升机制等,地方政府也会相应调整其目标函数,进而降低地方政府与企业合谋的概率。当前,中央政府大力推行生态文明视角下的政绩考核制度改革,这一制度是解开环境保护“囚徒困境”的关键所在。如前所述,地方政府之间的纳什均衡是导致排污企业与中央政府做出社会次优选择的关键节点。正由于地方政府唯增长的政绩考核制度,使得他们宁可牺牲青山绿水,也要争取GDP数字。中央政府建设生态文明的决定和举措无一不在通过各种途径告知地方政府,绿水青山将是政绩考核的重要标准,在多次重复博弈后,地方政府终将认识到这一点,从而解套“囚徒困境”。

  首先,新常态为经济与环境之间达成好的纳什均衡提供了改革保障。新常态下,中央政府大力推行生态文明视角下的政绩考核制度改革,这一制度解开了环境保护“囚徒困境”的症结。地方政府之间的纳什均衡是导致排污企业与中央政府做出社会次优选择的关键节点。正由于地方政府“重现实、轻未来”的政绩考核制度,使得他们在行为选择时宁可牺牲未来福利,也要争取当下利益。新常态下,中央政府建设生态文明的决定和举措无一不在通过各种途径告知地方政府,经济能否在未来实现可持续发展即将是政绩考核的重要标准,在多次重复博弈后,地方政府将认识到这一点,从而解套“囚徒困境”。

  其次,新常态为经济与环境之间达成好的纳什均衡提供了法制保障。新常态下,转型发展压力增大,环境保护形势严峻,群众期待不断提高,这要求环保部门必须不断增强法治意识、完善法律制度、创新执法手段。在此背景下,“新环保法”、“水十条”、“大气十条”、“土十条”等一系列环保法律法规逐步得以制定和实施,这为环保部门在新常态下严格监管执法提供了有力武器,为国家在新常态下平衡经济发展与环境保护的提供了法制保障。

  另外,新常态为经济与环境之间达成好的纳什均衡提供了经济保障。改革开放以来,两位数的经济增长速度为我国积累了大量的物质基础。尽管新常态下经济增长速度会相对放缓,但经济增量不会缩、经济质量反会增。新常态下,稳定增长的经济总量为我国淘汰落后产能提供了坚实后盾,不断提高的技术水平为我国优化产业结构提供了有力抓手,日益增长的环保投资为治污减排提供了经济保障。

   4 推进经济发展与环境保护之间理想的纳什均衡  

  当前环境管理的难点在于,面对环境博弈的“囚徒困境”和怪圈,我们既不能遏制企业间的竞争,又要尽可能保证整体利益的最大化。既然新常态为环境管理创造了机遇,提供了保障,那么该如何找到“囚徒困境”的要害,摆脱环保的“囚徒困境”,实现经济与环境之间理想的纳什均衡?如果说环境资产观的建立是从意识层面为摆脱环保“囚徒困境”扫清障碍,那么创新环境管理和机制设计则是从制度层面为摆脱环保“囚徒困境”保驾护航。

  博弈论告诉我们,要想从“囚徒困境”中解脱出来,达到理想的纳什均衡,必须要从游戏规则的制定入手,要让所有的决策主体知晓各方的支付函数和成本矩阵,要创造合作共赢的协作机制。所以,最重要的任务是借助政府这一外力制定新的“游戏规则”,以打破原有的“纳什均衡”。虽在在这一过程中会不可避免地限制一些企业和个体的利益,但必将带来社会整体的更大收益。

  第一,建立环境资产观,盘点环境资产、盘活环境资本。环境虽然没有价格,却有价值。利用环境资源时不需要支付价格,并不能否定环境是一种生产要素特性。应当将环境视为一种生产资料,从市场的视角有偿使用环境。为此,要加强环境信息平台建设,规范制定环境量化标准,利用环境资产负债表等工具盘点环境资产,以积极的环境资产观为每个地区创建环境资产账户。通过公开透明的信息公开,调动各利益主体的积极性,盘活环境资产,利用环境资产谋求新的增长方式。

  第二,建立健全环境成本内部化的政策措施和生态补偿机制,引导居民、企业和地方的预期。既然经济增长与环境保护的权衡发展结果是由多方博弈造成的,那么只要进行激励、约束机制创新,改变不同主体的目标函数和支付函数,就能够设法得到高水平的纳什均衡,实现新常态下经济发展与环境保护的双赢。在环境管理过程中,将外部成本内部化,是实现保证经济发展与环境保护两条底线的根本思路。一是针对企业征税、征费将外部性内部化。将环境看作生产资料,参与产品的产出,实现环境资源的有偿使用。将企业产生的污染与成本挂钩,让生产者承担治理污染的相应费用,从而有效减少污染的产生。二是构建地区间的生态补偿机制。环境产权不明晰是环境受到损害的主要原因。因此,应明确各方的权利与责任,明确补偿范围和补偿对象,建立合理规范的生态补偿核算体系,实现环境保护的成本转移支付。

  第三,建立有效的信息平台和多主体协商机制。可以主导建设三个平台:(1)企业、居民、社会各界共同参与的协作平台。(2)区域或流域性的政府协商合作平台。地方明确明晰地区间的环境财产权和使用权,有效避免环境管理过程中的政策失灵和市场失灵。通过地方政府的协商与共谋,使地区间形成利益整体,使原有的外部性完全内部化,从而有效达到资源的最佳配置。(3)构建污染源环境监管信息平台,公开环境责任的主体,不再让社会全体为个别企业的污染行为买单。

  第四,以生态文明为导向,通过政绩考核机制的改革实现对绿色发展的激励。破解环境保护“囚徒困境”的关键点在于改变地方政府环境管理的行为决策,而其关键在于建立新的以生态文明为核心的政绩考核标准。只有通过政绩考核改革,才能通过行政手段对环境保护进行有效的激励与制约。应该抛弃原有的只看任期内经济发展业绩的考核制度,建立以环境保护和经济建设协调发展为导向、重视可持续发展的长期成效的领导干部政绩考核指标,将环境保护作为考核的重中之重,从而实现对绿色发展的有效激励。

  推进基于生态文明政绩考核标准的关键在于中央政府是否有决心摆脱环境与经济的“囚徒困境”,是否有信心解决环境保护面临的困境,是否有耐心迎接经济的成功转型。这种决心既来自人民群众逐渐提高的环境需求,也来自作为社会计划者的责任;这种信心既包括升级环境技术、改进生产工艺的科技自信,也包括以生态文明为纲、以绿色发展为要的政治自信;这种耐心既源于对深化体制改革的充分准备,也源于我国环境问题本身的复杂性。

  经济发展与环境保护是发展与生态、人类与自然、现在与未来的一场无限次重复博弈。千金散尽还复来、生态环境却无复逆转。新常态下的经济与环境不再是冲突的、取舍的、权衡的,而是协调的、共进的、互促的;新常态下的经济与环境不再是守住金山银山、不顾绿水青山,而是守得住绿水青山、何愁金山银山!

(责任编辑: 省环保厅)