【博弈论-完全信息动态博弈】 子精炼博弈Nash均衡

9 篇文章 4 订阅
订阅专栏

子博弈精炼Nash均衡的定义

子博弈精炼Nash均衡的定义

扩展式博弈同样面临Nash均衡的多重性问题,而且有些均衡是明显不合理的。

子博弈

子博弈就是原博弈的一部分,它始于原博弈中一个位于单结信息集中的决策结,并由决策结 x x x及后续结共同组成。

子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

定义6.1 扩展式博弈的战略组合 s ∗ s^* s是一个子博弈精炼Nash均衡,当切仅当满足以下条件:

  1. 它是原博弈的Nash均衡;
  2. 它在每一个子博弈上给出Nash均衡。

说明:一个战略组合的子博弈精炼Nash均衡当且仅当它对所有的子博弈构成Nash均衡。

定理6.1 每个有限的扩展式博弈都存在子博弈精炼Nash均衡。

子博弈精炼Nash均衡的求解——逆向归纳法

有限扩展式博弈的一般步骤:

  1. 找出博弈的所有子博弈;
  2. 按照博弈进程的“反方向”,逐一求解各个子博弈,即最先求解最底层的子博弈再求解上一层的子博弈;

逆向归纳法对于完美信息的博弈问题尤为适用,所谓完美信息的博弈,是指每个参与人决策时都没有不确定性,也就是说,在博弈树中每个参与人的信息集都是单决策结的。

对于完美信息的博弈,子博弈精炼Nash均衡完全满足动态规划的最优性原理。

子博弈精炼的Nash均衡不仅在均衡路径上给出参与人的最优选择,而且在非均衡路径上也能给出参与人的最优选择。

但是Nash均衡给出的选择可能在非均衡路径上不是最优的,此时,这种战略称为“不可置信的威胁”。

逆向归纳法从本质上讲是一种重复剔除劣战略的过程,但是我们不能直接用重复剔除劣战略的思想来求解。

海盗分金问题

在这里插入图片描述
在这里插入图片描述

承诺行动和要挟诉讼

承诺行动

在这里插入图片描述
(不开发,(开发,开发))由于含有不可置信的威胁而不能成为子博弈精炼Nash均衡。

但是,如果在博弈开始之前,企业2采取某种行动使自己的支付发生改变,那么原来不可置信的威胁就可能变得可信。

企业2先花了1000万购买一手研发设备,那么博弈就成为了:
在这里插入图片描述

此时之前的不可置信的威胁就成为了购买设备这条子树的子精炼博弈的Nash均衡。

也就是说,企业2通过提前购买设备,使得自己在随后的博弈过程中无论如何都必须选择“开发”。此时,“企业2无论如何都会选择开发”这种战略,对企业1来说是可信的。

“企业2提前购买设备”这种行为在博弈论中称为“承诺行动”。

从本质上讲,承诺行动就是在博弈开始之前参与人采取的某种改变自己支付或行动空间的行动,该行动可使原本不可信的威胁变得可信。

参与人的承诺行动是有成本的,否则这种承诺就不可信。

由于这个成本在企业2采取承诺行动之后是无法收回的,因此也称为“沉淀成本”。

这一案例展现的是支付空间的改变。接下来给出行动空间的改变的案例。

在这里插入图片描述

应用——要挟诉讼

所谓要挟诉讼,指的是原告几乎不可能胜诉而其唯一的目的可能是希望通过私了得到一笔赔偿的诉讼。

下面给出要挟诉讼的模型。

请添加图片描述

请添加图片描述

通过逆向归纳法可以求出博弈的子博弈精炼Nash均衡位 ( ( 不 指 控 , 要 求 赔 偿 , 放 弃 ) , 拒 绝 ) ((不指控,要求赔偿,放弃),拒绝) ((,,),)

上述模型中,“要挟”之所以没有成功,关键在于原告将会起诉的威胁并不可信。

我们可以采取的承诺行动是,在指控被告的同时,甚至在指控之前就将诉讼费 p p p支付给律师,无论以后是否上法庭,这笔费用都不退还。

请添加图片描述

s > γ x s\gt\gamma x s>γx时,原告才会愿意私了而不是上法庭;
s < γ x + d s\lt\gamma x+d s<γx+d时,被告将愿意私了而不是上法庭;

因此存在了一个私了的区域 [ γ x , γ x + d ] [\gamma x,\gamma x+d] [γx,γx+d]

同时,被告也可以采取自己的承诺行动来避免一些无端指控,即在关于私了的协商未开始前,预先支付律师费,也不能收回。

那么要挟诉讼中的私了区域是 [ γ x , γ x + d − f ] [\gamma x,\gamma x+d-f] [γx,γx+df]。沉淀成本 f f f的存在使得私了的区域变小。
请添加图片描述
虽然采取承诺行动可以一定程度上减少被告可能遇到的无端状况,但是被告在设置沉淀成本 f f f时,还面临两个问题:

  1. 被告如何设定 f f f的大小。 f f f过大,对被告来讲可能得不偿失; f f f过小又可能无法有效阻止各种无端指控的发送;
  2. 被告何时设置。如果预先支付了,但指控没有发送,这笔钱就浪费了;好的方法是购买法律保险。

子博弈精炼Nash均衡的特性

子博弈精炼Nash均衡的合理性

子博弈精炼Nash均衡与人们直觉的差异

子博弈精炼Nash均衡的特性是:不仅要求在博弈到达的路径上参与人的选择最优,而且要求在博弈没有达到的路上参与人的选择也要最优。

差异的原因:现实中人们的理性最多能确保在博弈到达的路径上人们的选择最优。

只看到了自己预测到的结果,忽视了自己没预测到的结果,没有综合考虑。

在这里插入图片描述
蜈蚣博弈的唯一子博弈精炼Nash均衡是:在博弈的任一阶段,每个参与人都选择终止博弈。

但是实验表明,大部分人会在60~70轮之间进行终止。

逆向归纳法对理性的要求

子博弈精炼Nash均衡不仅要求“参与人完全理性”,而且要求“参与人完全理性”为共同知识,否则无法采用逆向归纳法求解。

同时,有些情况下还要求每个参与人不会“犯错误”,而且要求每个参与人都会预期到其他人不会犯错误。

子博弈精炼Nash均衡的唯一性

提出子博弈精炼Nash均衡的主要目的是克服Nash均衡的多重性。但是我们讨论的博弈问题仍然可能存在多个子博弈精炼Nash均衡。

在完美信息扩展博弈中,如果不存在这样的参与人,该参与人在某一决策结上对自己的选择所导致的结果是无差异的,那么博弈存在唯一的子博弈精炼Nash均衡。

如果有这样的参与人,选择对自己的选择导致的结果无差异,那么博弈会存在多个子博弈精炼Nahs均衡。

上述结论只适用于完美信息的扩展式博弈,对信息完全但是不完美的扩展式博弈不一定适用。

那么关于信息完全但不完美的博弈存在唯一子博弈精炼Nash均衡的条件:如果博弈的每个子博弈都只存在唯一的Nash均衡,那么该博弈只有唯一的子博弈精炼Nash均衡。

动态博弈篇——博弈纳什均衡(subgame equilibrium)
thompson的博客
10-30 2570
举例
博弈论博弈精炼均衡(博弈都是纳什均衡,比纳什均衡更强的概念)
ResumeProject的博客
08-25 7733
扩展型转化为正则型 但是不是完全等价的,⇒但是不是完全等价的,\Rightarrow但是不是完全等价的,⇒ 扩展性博弈纳什均衡 完美信息博弈存在纯策略纳什均衡完美信息博弈存在纯策略纳什均衡完美信息博弈存在纯策略纳什均衡 不绿的是弱一点的纳什均衡,但是用矩阵并不好解释不绿的是弱一点的纳什均衡,但是用矩阵并不好解释不绿的是弱一点的纳什均衡,但是用矩阵并不好解释 博弈精炼均衡 博弈博弈树中的博弈精炼均衡博弈都是纳什均衡,比纳什均衡更强的概念 博弈博弈树中的树\\ 博弈精炼均衡博弈
博弈精炼纳什均衡+贝叶斯法则+信号博弈.pdf
10-29
博弈精炼纳什均衡+贝叶斯法则+信号博弈.pdf
完全信息动态博弈博弈精炼纳什均衡
ThePythonFucker的博客
04-21 8908
首先,放一下完全信息动态博弈的定义: 博弈信息完全的,即双方都掌握参与者对他参与人的 战略 空间和 战略组合 下的 支付函数 有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 说人话就是: 参与双方不再是同时决策,有先后,并且当一方开始决策之前他可以知道已经发生了的决策 同时的决策像是这样的表 有先后的决策一般都画树 在上上图画表的决策过程都会有一个纳什均衡,而上图这种也有,不过不叫纳什均衡,有一个复杂点的名字,叫
一个简单的完全信息动态博弈的解答
weixin_34416754的博客
02-23 841
  版权申明:本文为博主窗户(Colin Cai)原创,欢迎转帖。如要转贴,必须注明原文网址   http://www.cnblogs.com/Colin-Cai/p/8457744.html   作者:窗户   QQ:6679072   E-mail:6679072@qq.com   前几天,看到博客园里有人给了一道博弈:   事先给定一个正整数N,两个...
博弈论笔记】第三章 完全且完美信息动态博弈
小白有颗大白梦的博客
06-23 3080
介绍了博弈论中的完全且完美信息动态博弈,主要是逆推归纳法和博弈完美纳什均衡的使用,以及拓展分析方法,还介绍了常见的四种模型:斯塔克博弈、劳资博弈、议价博弈、委托代理理论。
博弈论学习笔记(3)——完全信息动态博弈
猪猪和超超的博客
10-31 2953
在这个部分,我们学习的是完全信息动态博弈。主要内容包括扩展式博弈博弈精炼Nash均衡、重复博弈博弈精炼Nash均衡的应用。
博弈精炼Nash均衡PPT学习教案.pptx
10-02
博弈精炼Nash均衡PPT学习教案.pptx
n 人有限非合作博弈计算一个纳什均衡.rar_Nash-Equilibrium_nash_n人博弈_tip9qr_博弈纳什均衡
07-15
n 人有限非合作博弈计算一个纳什均衡 N human finite non cooperative game for computing a Nash equilibrium
深圳大学博弈论两页纸笔记含有2020考题信息.zip
01-05
第7讲 动态博弈 第8讲 重复博弈 第9讲 进化博弈 第10讲 不完全信息和逆向选择 第11讲 信号传递 第12讲 拍卖(1) 第12讲 拍卖 第13讲 投票 第14讲 合作博弈 包含深圳大学2020级研究生博弈论考题信息 以及判断题资料
博弈论之策略型博弈Nash均衡.pptx
03-15
博弈论之策略型博弈Nash均衡.pptx
博弈论-完全信息动态博弈】 重复博弈
weixin_46365033的博客
06-13 1618
定义7.1 给定阶段博弈G,G重复进行T次的有限重复博弈是指:有限重复博弈有以下特征:定理7.1 如果阶段博弈只有唯一的Nash均衡,则有限重复博弈的唯一博弈精炼Nash均衡为参与人在每阶段中都采用的Nash均衡战略。当阶段博弈只有唯一的Nash均衡时,有限重复博弈本质上是阶段博弈的简单重复。定理7.2 如果阶段博弈G中存在多个Nash均衡,则G(T)G(T)G(T)中可能存在这样的博弈精炼Nash均衡,在该均衡中,对每一t......
博弈论】【第三章】完全信息动态博弈(二):无限次重复博弈
Gorege__Hu的博客
03-29 1248
给定一博弈G,无限次重复进行G博弈的过程称为G的“无限次重复博弈”,记为G∞δ,其中是各参与人得益共同的贴现系数δ。并且,对任意的t,在进行第t阶段(第t次重复)博弈之前,所有参与人都能看到前t−1阶段博弈的结果。各参与人在G∞δ中的“得益”等于各阶段得益的现在值。
纳什均衡
热门推荐
iptracker的博客
06-22 2万+
纳什均衡 如果对于所有参与人iii有ui(σi∗,σ−i∗)≥ui(si,σ−i∗)(si∈Si)u_i(\sigma_i^*,\sigma_{-i}^*)\ge u_i(s_i,\sigma_{-i}^*)\quad(s_i\in S_i)ui​(σi∗​,σ−i∗​)≥ui​(si​,σ−i∗​)(si​∈Si​)那么混合策略组合σ∗\sigma^*σ∗是一种纳什均衡 严格纳什均衡 如果...
首都师范 博弈论 6 3 1博弈博弈完美均衡的概念
枫林晚的博客
08-25 577
6 3 1博弈博弈完美均衡的概念
如何计算近似纳什均衡_博弈 | 精炼贝叶斯纳什均衡
weixin_39600291的博客
11-20 2049
精炼贝叶斯纳什均衡博弈论中的一个重要概念。为使逻辑表述方便,我们取二人博弈来讲解。在一般情况下,博弈的双方都有一套属于自己的策略集,像是剪刀石头布一样,博弈双方作为局中人,是不知道在接下来的猜拳中,对方会出哪种手势,但如果知道对方出各种手势的概率,那么自己可以针对对方出各种手势的概率来定出自出哪种手势赢的概率大,如果可以量化的话,可以认为这是使自己的期望收益最大化。下图是本文框架:在讲解贝叶斯纳...
[每日一题]169:找出最大的可达成数字
最新发布
AngelDg的博客
05-21 356
题目要求得一个最大的整数 x,使其在不超过 t 次操作内变成与 num 相等的数字。每次操作可以选择将 x 增加或减少 1,同时可以选择将 num 增加或减少 1。返回所有可达成数字中的最大值。可以证明至少存在一个可达成数字。给你两个整数 num 和 t。
算法】【二叉树,DFS,哈希集合,分类讨论】力扣1110. 删点成林
未来就在脚下。
05-20 956
本题通过DFS遍历二叉树,结合分类讨论的方法,逐步删除指定节点并生成新的森林。该算法有效地处理了节点删除后树结构的调整问题,并通过哈希集合优化删除判断的时间复杂度,最终实现了高效的解决方案。
力扣62 不同路径 Java版本
m0_47066863的博客
05-20 382
机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。从左上角开始,总共有 3 条路径可以到达右下角。题目数据保证答案小于等于 2 * 109。输入:m = 3, n = 7。输入:m = 3, n = 2。输入:m = 7, n = 3。输入:m = 3, n = 3。问总共有多少条不同的路径?
非合作博弈论麻雀搜索算法求解纳什均衡matlab
05-25
非合作博弈论中的麻将游戏是一个经典的博弈模型,可以使用麻雀搜索算法来求解纳什均衡。下面是一个简单的 MATLAB 代码示例: ```matlab % 定义麻雀游戏的博弈矩阵 payoff = [2, 0, 1; 0, 1, 3; 1, 3, 2]; % 定义麻雀游戏的两个玩家 players = [1, 2]; % 定义麻雀游戏的策略空间 strategies = [3, 3]; % 使用麻雀搜索算法求解纳什均衡 nash_eq = nash(payoff, strategies); % 输出纳什均衡策略 fprintf('Player 1 strategy: %s\n', mat2str(nash_eq{1})); fprintf('Player 2 strategy: %s\n', mat2str(nash_eq{2})); ``` 在上面的代码中,我们首先定义了麻雀游戏的博弈矩阵 `payoff`,其中第 i 行第 j 列的元素表示玩家 1 选取第 i 种策略,玩家 2 选取第 j 种策略时的收益。然后定义了麻雀游戏的两个玩家 `players` 和策略空间 `strategies`。最后,使用 MATLAB 内置的 `nash` 函数求解纳什均衡,并输出纳什均衡策略。 需要注意的是,麻雀搜索算法只能求解小规模的博弈模型,在实际应用中需要根据具体情况选择更加高效的算法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 模电_第八章_功率放大电路 8603
  • 数电_第三章_逻辑代数基础 7568
  • 数电_第九章_数模模数转换 7081
  • 模电_第七章_正弦波振荡电路 6874
  • 伪代码的书写规范 6425

分类专栏

  • 计算机网络 10篇
  • Res 2篇
  • 细粒度图像识别 13篇
  • 我的项目 6篇
  • 深度学习基础 23篇
  • 博弈论 9篇
  • 视频分割 9篇
  • 算法竞赛入门 14篇
  • 机器学习 23篇
  • 知识工程 3篇
  • 数据结构、算法与应用(C++) 12篇
  • 智能机器人 6篇
  • 基于《算法图解》与《数据结构与算法(python语言实现)》 15篇
  • c++ 36篇
  • 电子技术 25篇
  • 图像处理基础 2篇
  • 自然语言处理 8篇
  • matplotlib 2篇
  • 目标检测 12篇
  • pytorch 18篇
  • 信息论 1篇
  • OpenCV 8篇
  • numpy 4篇

最新评论

  • 第十五章 奇异值分解

    2301_80882537: 请问这是哪本书

  • Zero-Shot Graph Relation Prediction through Commonsense Knowledge Integration

    呆呆囧想学C++: 请问,你有复现这篇论文吗?

  • 第十五章 奇异值分解

    slq5007: SVD性质叙述中的5.1、5.2有误.两句中的值域和零空间需要相互颠倒一下就对了,表情包

  • 模电_第八章_功率放大电路

    salm啊: otl的pv写错了哦,π在下面

  • Decoupled Sparial-Temporal Attention Network forSkeleton-Based Action Recognition

    qq_44844494: 您好,请问有这篇文章的pdf吗

最新文章

  • 数据网络理论基础 第五章 路由算法
  • 数据网络理论基础 第四章 多址协议性能分析
  • 数据网络理论基础 第三章网络的时延模型
2024年5篇
2023年19篇
2022年96篇
2021年157篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

右边是我女神

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

聚圣源公司起名查凶了起名字男孩小名儿子报警称被父亲用摄像头监控九五之尊香烟棋牌室取名起名大全交友男起名字小布头驾驶员考试网欲望保姆电影完整版看好好游戏 起名香港向世贸组织申诉属鼠起什么小名好韩姓男孩起名大全牛年八卦易学起名带有睿字起名杨博任黑龙江副省长起名字男孩2020免费八字起名逃亡犯报告西北马家军95105688起名大全免费取名2020男免费起名字网站大全如何起厂名字起名一什么好听的名字起名网的孩子茅以升给姓宋的宝宝起个好名字陕西高起本报名猪小儿起名宜用淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化