联防链、回合差与先读
-
补充一些内容,抛砖引玉:
如何做先读:基于凯利公式的决策优化
在宝可梦对战中,先读是实现回合差的关键手段,而凯利公式提供了一种数学框架,帮助玩家在风险与收益之间找到最优决策。以下是具体分析:
1. 凯利公式的原理
凯利公式的核心思想是最大化长期收益的复利增长,同时平衡风险与收益。其公式为:
[ f* = (bp - q)/(b) ]
其中:- ( f* ) 是最优下注比例;
- ( b ) 是净赔率(赢时的收益率);
- ( p ) 是胜率;
- ( q ) 是失败概率(( q = 1 - p ))。
凯利公式的目标是通过计算最优下注比例,避免过度冒险导致破产,同时充分利用有利机会。
2. 凯利公式与先读策略的相关性
在宝可梦对战中,先读可以类比为一种“下注”行为,玩家需要根据对手的决策概率和收益比来决定是否冒险。具体来说:
- 胜率 ( p ):先读成功的概率,例如对手是否会换下精灵。
- 净赔率 ( b ):先读成功的收益与失败的损失之比,例如击败对手精灵的收益与被反读的损失。
- 失败概率 ( q ):先读失败的概率,例如对手选择保留精灵。
通过凯利公式,玩家可以计算出是否值得冒险先读,从而优化决策。
3. 如何做先读
-
概率评估:
- 计算先读成功的概率 ( p ) 和失败的概率 ( q )。例如,土猫对火钢时,一个地震就能击败对手,这种情况下逼迫性很强,先读成功率较高。
- 评估先读成功的收益 ( b ) 和失败的损失 ( q )。例如,击败对手精灵的收益与被反读的损失。
-
凯利公式的应用:
- 将上述参数代入凯利公式,计算最优下注比例 ( f* )。如果 ( f* > 0 ),说明值得冒险先读;反之则不值得。当然这并非绝对。
-
对手心理分析:
- 赢面较大的玩家通常更保守,担心被反读的损失;而即将输掉的玩家则更激进,因为不读只能等输,必须冒险。
-
信息差利用:
- 通过制造信息差,赌对手的价值判断失误。例如,对手可能认为你会换下某个精灵,但实际上你选择保留,从而打乱对手的节奏。这也往往是地雷的作用,通过新配置误导对手判断错误精灵在联防链中的价值,进而制造优势。
总结
先读并非完全依赖直觉,而是基于概率评估和凯利公式的决策优化。通过精准判断对手策略、评估风险与收益,并利用信息差,玩家可以在动态对战中最大化先读的成功率,从而在回合差上占据优势。
在对阵高水平对手时,对手的思考往往也会基于以上的考量,这时候我们就会见到一些例如火钢对着土猫读土猫ut点钉的操作。尽管我们可以将先读的层数(反读 反反读之类)看做是一种猜拳,但是这种猜拳到底并不是一种五五开向的猜拳。在一场bo3的对局中,对手前几局的思路也会给予你反馈,判断对手的一定操作习惯,做出更有利的决策。
当然以上的内容仍充满了这种理想化的思考,实际情况往往更加复杂多变且难以分析清楚b的具体量化值,这就需要我们多加进行实战,提升队伍的熟练度与整体大局观,才能更好计算清晰整体把握。
-
还是虚无厉害
-
@虚无而已 中國寶圈的尼姆佐維奇!
-
好久没看到新的理论帖了,还是来自一位入坑不久的玩家,令人惊叹。
脑子里第一时间蹦出来的话
“花半秒钟就看透事物本质的人,和花一辈子都看不清事物本质的人,注定是截然不同的命运。”
虽然帖子里的知识我都模糊的知道且能运用,但是能将其简洁的提炼成理论也是让我这个玩了好几年却依然只会点点点的玩家感到惭愧啊(笑 -
提供一点小建议:
1.对于回合差其实可以参考棋类的棋理,将其量化为某一类似于“X手先手”的概念,例如送掉xx相当于拿到xx手的先手,从而为先读风险和收益提供基础参数。当然这个是需要结合环境以及海量的rep去做分析的,可以找一些志同道合的玩家一起完成,目前我们确实很缺少这方面的研究。
2.对于凯利公式中的概率p,这个概率除了场况还取决于操作习惯(可以通过赛前的scout进行估测)以及全局的情况,而不仅仅只是单回合的对位关系,可以优化一二。
3.比赛当中个人感觉很难在有限的时间内完成大量的逻辑思考,因此个人建议如果仍然有兴趣进一步完善该理论的话可以考虑根据这些概念推导出一部分简单易记的结论(类似于某种定式,或固定解法)作为新人快速形成大局观的捷径,更有实际意义。
讲道理真的好几年没看到愿意从机理层面去分析对战的玩家了,如果有兴趣的话可以建立一个团队来共同完成这个工程。 -
@冰鸟
1.其实回合差更多的在强调一个回合利用率的问题,逻辑就是通过分析联防链,判断出最高效破坏联防链的位置,利用先读双换的操作将低效精灵的出手权转移到高效精灵上去
2.你说的这一点我在倒数第二段也有所提及
3.后续考虑更新一些实例加以说明,帮助理解。结论可能更多会基于残局来给出,因为这比较清晰也比较容易。 -
我也分享一下我以前思考过得,考虑过用博弈论方法(矩阵对策)看待这个游戏,就是考虑横向是自己的所有操作,纵向是对手的所有操作,给每一种情况的局势赋一个值代表这种情况的局势,然后就能计算出最优解。
最优解往往是混合策略,(例如,1/3概率点十万伏特,1/3概率点觉冰,1/3概率换精灵B)
不过这种方法目前也只能作为一个观点,帮助理解这个游戏。通常没有人真的用这种暴力计算的方法玩这个游戏。主要是赋值对人类来说还是太不直观,宝可梦这个游戏收益不容易量化,赋值赋得不合理还不如自己想。比如说,可以简单枚举一下你点A他点B的情况是什么样子,是否能够接受,然后再进行一个决策(当然是用人类的思考方式进行,不是用暴力计算)
我曾经在cpl的gen2ou拆受局当中采取过50%舍身撞 50%喷射火焰的随机抽技能的方法,最后真抽到了火放攻击到对手核果。我想应该也只有这种简单的混合策略可以使用 -
另外我有想过把宝可梦分成四个大类,可以借助“联防链”来讲一下。不知道我理解是否和你讲的一样,我理解的联防链断裂就是指对手有一只精灵你全队都拦不住,就是联防链断裂了
1.极快(容错空间极低,通常要求精准先读或选出,如1v1,2v2和63,一部分vgc,精准先读就是胜负的关键)
2.标准单打(绝大多数66单打模式,胜负的关键是A.通过运营抢先打破联防链B.强化一波推队,重点是两个问题:1.对着谁强化 2.削弱哪些精灵才可以一波推C.打死对手的关键进攻精灵,使得对手无法打破你的联防链)
3.标准双打(比较强调轮转的双打模式,通常通过制造安全精灵取得优势,安全精灵就是这只精灵下回合即使不保护也不会死,但制造安全精灵的方法有多种:A.被动掩护,如看我嘛或有不确定性的位置交换B.主动出击,队友或自己先手打死/队友拍住能秒它的精灵C.替身或强化防御站场)
4.极慢(一些平均回合数很长的模式,通常要经过持久的拉锯才能取得突破,主要有一些前两代的模式和一些BH。在这类模式下往往不太考虑多快打破联防链的问题,而是能不能打破联防链的问题。一般来说,关键是先进行充分侦查,再非常小心并尽可能多地利用关键进攻手进行进攻)
值得注意的是,我觉得本文着重讲解的是2类当中的方法A,但是我感觉这不总是胜负的关键。有时候会有这种情况:玩家1首先打破联防链,因此人头比玩家2多,但玩家2之后为它的强化精灵进行铺垫,后打破联防链,虽然人头少但一波把玩家1推了,这属于B方法。C方法主要是一些受队的方法,不打破对方的联防而是打破对手的进攻精灵;另外理论上当对手采取B强化推队时,你高度提防一些精灵强化推队也属于C方法。 -
@hybone
矩阵的方法 以前构思过,后来发现不太合适,主要就是混合策略并不能说明问题,没有什么比较好的实际意义。基本只有在存在单解的情况下才比较好用。 -
@hybone
你说的134模式涉猎较少,不太能做出评价。
基于单打进行继续补充。
B中强化推队的本质通常在于先手击倒来创造凭空回合,也就是我提到的第四段速度与回合差。我们知道人头优势并不能等同于胜利,利用卡场来强化是获胜手段的一种,但是我们需要明晰为什么这么做。本质是我们可以利用这个强化压缩掉联防链中的剩余回合。
C方法则是利用方法达到己方精灵都处于"如果某个精灵无法突破对手的克制,其断裂时间可以视为无穷大。"的状态,进而以无穷打有限,获得胜利。当然一些特殊的pp攻也是类似。