【博弈论-完全信息动态博弈】子精炼博弈Nash均衡

右边是我女神

已于 2022-06-13 19:15:42 修改

阅读量4.1k

收藏 22

点赞数 3

分类专栏：博弈论文章标签：算法

于 2022-06-13 16:50:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/weixin_46365033/article/details/125256477

版权

博弈论专栏收录该内容

9 篇文章 4 订阅

订阅专栏

子博弈精炼Nash均衡的定义

子博弈精炼Nash均衡的定义

扩展式博弈同样面临Nash均衡的多重性问题，而且有些均衡是明显不合理的。

子博弈

子博弈就是原博弈的一部分，它始于原博弈中一个位于单结信息集中的决策结，并由决策结 $x$ 及后续结共同组成。

子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构。

定义6.1 扩展式博弈的战略组合 $s^*$ 是一个子博弈精炼Nash均衡，当切仅当满足以下条件：

它是原博弈的Nash均衡；
它在每一个子博弈上给出Nash均衡。

说明：一个战略组合的子博弈精炼Nash均衡当且仅当它对所有的子博弈构成Nash均衡。

定理6.1 每个有限的扩展式博弈都存在子博弈精炼Nash均衡。

子博弈精炼Nash均衡的求解——逆向归纳法

有限扩展式博弈的一般步骤：

找出博弈的所有子博弈；
按照博弈进程的“反方向”，逐一求解各个子博弈，即最先求解最底层的子博弈再求解上一层的子博弈；

逆向归纳法对于完美信息的博弈问题尤为适用，所谓完美信息的博弈，是指每个参与人决策时都没有不确定性，也就是说，在博弈树中每个参与人的信息集都是单决策结的。

对于完美信息的博弈，子博弈精炼Nash均衡完全满足动态规划的最优性原理。

子博弈精炼的Nash均衡不仅在均衡路径上给出参与人的最优选择，而且在非均衡路径上也能给出参与人的最优选择。

但是Nash均衡给出的选择可能在非均衡路径上不是最优的，此时，这种战略称为“不可置信的威胁”。

逆向归纳法从本质上讲是一种重复剔除劣战略的过程，但是我们不能直接用重复剔除劣战略的思想来求解。

海盗分金问题

承诺行动和要挟诉讼

承诺行动

(不开发,(开发,开发))由于含有不可置信的威胁而不能成为子博弈精炼Nash均衡。

但是，如果在博弈开始之前，企业2采取某种行动使自己的支付发生改变，那么原来不可置信的威胁就可能变得可信。

企业2先花了1000万购买一手研发设备，那么博弈就成为了：

此时之前的不可置信的威胁就成为了购买设备这条子树的子精炼博弈的Nash均衡。

也就是说，企业2通过提前购买设备，使得自己在随后的博弈过程中无论如何都必须选择“开发”。此时，“企业2无论如何都会选择开发”这种战略，对企业1来说是可信的。

“企业2提前购买设备”这种行为在博弈论中称为“承诺行动”。

从本质上讲，承诺行动就是在博弈开始之前参与人采取的某种改变自己支付或行动空间的行动，该行动可使原本不可信的威胁变得可信。

参与人的承诺行动是有成本的，否则这种承诺就不可信。

由于这个成本在企业2采取承诺行动之后是无法收回的，因此也称为“沉淀成本”。

这一案例展现的是支付空间的改变。接下来给出行动空间的改变的案例。

应用——要挟诉讼

所谓要挟诉讼，指的是原告几乎不可能胜诉而其唯一的目的可能是希望通过私了得到一笔赔偿的诉讼。

下面给出要挟诉讼的模型。

通过逆向归纳法可以求出博弈的子博弈精炼Nash均衡位 $((不指控, 要求赔偿, 放弃), 拒绝)$

上述模型中，“要挟”之所以没有成功，关键在于原告将会起诉的威胁并不可信。

我们可以采取的承诺行动是，在指控被告的同时，甚至在指控之前就将诉讼费 $p$ 支付给律师，无论以后是否上法庭，这笔费用都不退还。

$s\gt\gamma x$ 时，原告才会愿意私了而不是上法庭；
$s\lt\gamma x+d$ 时，被告将愿意私了而不是上法庭；

因此存在了一个私了的区域 $[\gamma x,\gamma x+d]$ 。

同时，被告也可以采取自己的承诺行动来避免一些无端指控，即在关于私了的协商未开始前，预先支付律师费，也不能收回。

那么要挟诉讼中的私了区域是 $[\gamma x,\gamma x+d-f]$ 。沉淀成本 $f$ 的存在使得私了的区域变小。

虽然采取承诺行动可以一定程度上减少被告可能遇到的无端状况，但是被告在设置沉淀成本 $f$ 时，还面临两个问题：

被告如何设定 $f$ 的大小。 $f$ 过大，对被告来讲可能得不偿失； $f$ 过小又可能无法有效阻止各种无端指控的发送；
被告何时设置。如果预先支付了，但指控没有发送，这笔钱就浪费了；好的方法是购买法律保险。

子博弈精炼Nash均衡的特性

子博弈精炼Nash均衡的合理性

子博弈精炼Nash均衡与人们直觉的差异

子博弈精炼Nash均衡的特性是：不仅要求在博弈到达的路径上参与人的选择最优，而且要求在博弈没有达到的路上参与人的选择也要最优。

差异的原因：现实中人们的理性最多能确保在博弈到达的路径上人们的选择最优。

只看到了自己预测到的结果，忽视了自己没预测到的结果，没有综合考虑。

蜈蚣博弈的唯一子博弈精炼Nash均衡是：在博弈的任一阶段，每个参与人都选择终止博弈。

但是实验表明，大部分人会在60～70轮之间进行终止。

逆向归纳法对理性的要求

子博弈精炼Nash均衡不仅要求“参与人完全理性”，而且要求“参与人完全理性”为共同知识，否则无法采用逆向归纳法求解。

同时，有些情况下还要求每个参与人不会“犯错误”，而且要求每个参与人都会预期到其他人不会犯错误。

子博弈精炼Nash均衡的唯一性

提出子博弈精炼Nash均衡的主要目的是克服Nash均衡的多重性。但是我们讨论的博弈问题仍然可能存在多个子博弈精炼Nash均衡。

在完美信息扩展博弈中，如果不存在这样的参与人，该参与人在某一决策结上对自己的选择所导致的结果是无差异的，那么博弈存在唯一的子博弈精炼Nash均衡。

如果有这样的参与人，选择对自己的选择导致的结果无差异，那么博弈会存在多个子博弈精炼Nahs均衡。

上述结论只适用于完美信息的扩展式博弈，对信息完全但是不完美的扩展式博弈不一定适用。

那么关于信息完全但不完美的博弈存在唯一子博弈精炼Nash均衡的条件：如果博弈的每个子博弈都只存在唯一的Nash均衡，那么该博弈只有唯一的子博弈精炼Nash均衡。

右边是我女神

3
点赞
踩
22

收藏

觉得还不错? 一键收藏
打赏
0
评论
【博弈论-完全信息动态博弈】子精炼博弈Nash均衡

扩展式博弈同样面临Nash均衡的多重性问题，而且有些均衡是明显不合理的。子博弈就是原博弈的一部分，它始于原博弈中一个位于单结信息集中的决策结，并由决策结xxx及后续结共同组成。子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构。定义6.1 扩展式博弈的战略组合s∗s^*s∗是一个子博弈精炼Nash均衡，当切仅当满足以下条件：说明：一个战略组合的子博弈精炼Nash均衡当且仅当它对所有的子博弈构成Nash均衡。定理6.1 每个有限的扩展式博弈都存在子博弈精炼Nash均衡。有限扩展式博弈的一般步
复制链接

扫一扫

右边是我女神 CSDN认证博客专家 CSDN认证企业博客

277: 原创

2万+: 周排名

4万+: 总排名

27万+: 访问

: 等级

3307: 积分

1631: 粉丝

436: 获赞

68: 评论

1929: 收藏

写文章

热门文章

模电_第八章_功率放大电路 8603
数电_第三章_逻辑代数基础 7568
数电_第九章_数模模数转换 7081
模电_第七章_正弦波振荡电路 6874
伪代码的书写规范 6425

分类专栏

计算机网络 10篇
Res 2篇
细粒度图像识别 13篇
我的项目 6篇
深度学习基础 23篇
博弈论 9篇
视频分割 9篇
算法竞赛入门 14篇
机器学习 23篇
知识工程 3篇
数据结构、算法与应用（C++） 12篇
智能机器人 6篇
基于《算法图解》与《数据结构与算法（python语言实现）》 15篇
c++ 36篇
电子技术 25篇
图像处理基础 2篇
自然语言处理 8篇
matplotlib 2篇
目标检测 12篇
pytorch 18篇
信息论 1篇
OpenCV 8篇
numpy 4篇

最新评论

第十五章奇异值分解
2301_80882537: 请问这是哪本书
Zero-Shot Graph Relation Prediction through Commonsense Knowledge Integration
呆呆囧想学C++: 请问，你有复现这篇论文吗？
第十五章奇异值分解
slq5007: SVD性质叙述中的5.1、5.2有误.两句中的值域和零空间需要相互颠倒一下就对了，
模电_第八章_功率放大电路
salm啊: otl的pv写错了哦，π在下面
Decoupled Sparial-Temporal Attention Network forSkeleton-Based Action Recognition
qq_44844494: 您好，请问有这篇文章的pdf吗

最新文章

数据网络理论基础第五章路由算法
数据网络理论基础第四章多址协议性能分析
数据网络理论基础第三章网络的时延模型

目录

目录

分类专栏

计算机网络 10篇

细粒度图像识别 13篇

我的项目 6篇

深度学习基础 23篇

视频分割 9篇

算法竞赛入门 14篇

机器学习 23篇

知识工程 3篇

数据结构、算法与应用（C++） 12篇

智能机器人 6篇

基于《算法图解》与《数据结构与算法（python语言实现）》 15篇

电子技术 25篇

图像处理基础 2篇

自然语言处理 8篇

matplotlib 2篇

目标检测 12篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

打赏作者

右边是我女神 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

您的余额不足，请更换扫码支付或充值

打赏作者

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

聚圣源公司起名查凶了起名字男孩小名儿子报警称被父亲用摄像头监控九五之尊香烟棋牌室取名起名大全交友男起名字小布头驾驶员考试网欲望保姆电影完整版看好好游戏起名香港向世贸组织申诉属鼠起什么小名好韩姓男孩起名大全牛年八卦易学起名带有睿字起名杨博任黑龙江副省长起名字男孩2020免费八字起名逃亡犯报告西北马家军 95105688 起名大全免费取名2020男免费起名字网站大全如何起厂名字起名一什么好听的名字起名网的孩子茅以升给姓宋的宝宝起个好名字陕西高起本报名猪小儿起名宜用淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故已致13死高中生被打伤下体休学邯郸通报李梦为奥运任务婉拒WNBA邀请 19岁小伙救下5人后溺亡多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警 315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人？周杰伦一审败诉网易房客欠租失踪房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高？胖东来员工每周单休无小长假 “开封王婆”爆火：促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化