关于回合制游戏的先手优势有哪些平衡手段?

单人,双人回合制与多人回合制中的平衡手法有哪些异同
关注者
676
被浏览
197,165

57 个回答

首先上很多人知道的策梅洛定理:

任何透明的、确定性的双人有限游戏,定有一方存在必不败的策略。

一般地,为了保证玩家的游戏体验,回合制游戏中玩家的行为本身应当与“优势”有直接关联,游戏目标也经常是两类显性的目标:“率先达成目标”或者“尽量多得分”,或者两者的混合。

率先达成目标:(举例)

  • 先把对面的生命打到零。
  • 先凑足五个子。
  • 先赚他一个亿。

尽量多得分:(举例)

  • 规定时间内尽量多打倒对方。
  • 在局数耗尽前多赚钱。
  • 在双方无处可下之前,尽量多占地盘(围棋)。

因此第一个进行行动的玩家在绝大多数时候也意味着第一个得到优势,而在上述环境里,很容易就变成先手必胜(或不败)的游戏。当然世界上也存在后手必胜的游戏,比如“石头-剪刀-布”变成先后手回合制,比如特定堆数组合的Nim游戏(轮流从堆中拿走棋子/火柴,直到有一方无子可拿)。


(三堆火柴组成的Nim游戏)

确切地说,我个人会将回合制游戏分为“行动主导”和“反制主导”,来区分这两类游戏。

行动主导

  • 玩家的行动回合本身被视为游戏中珍贵的核心资源。
  • 玩家可以执行的行动中绝大多数都会直接往游戏目标靠近,并且很多时候可以直接量化。(局部最优解与全局最优解很接近,因此允许“贪心法”简化决策空间。)
  • 允许Strategy-stealing,也就是先手可以在第一轮进行明显带有优势的行动,然后复制后手的必胜策略(如果存在),因此普遍存在先手优势。

反制主导

  • 玩家根据对手前一行动的策略来进行互动和反制,对游戏目标有决定性的作用。
  • 相比之下,玩家执行的行动未必对胜利都有贡献,有时反而会帮倒忙。(局部最优解与全局最优解关联不高)
  • 可以从先行者的策略中做出针对,或者从先行者身上学习失败经验,因此许多情况下存在后手优势。

过于强调反制主导的游戏有个致命缺陷,就是即时的反馈不够直观,玩家难以在每一步行动中都找到乐趣(或者说,选择意义的缺失),容易破坏“心流”。所以它们的普遍受众比较小,因此现在市面上的例子还是行动主导的为主。


要平衡一个行动主导的回合制游戏中先手优势的影响,可以从数值、机制等等各个角度出发来寻找可行的方案。下面分析一些值得参考的方向和思路,结合实际情况来服用。


=== 思路一:“让数字说话” ===


减少初始资源与选择空间:

基于卡牌的回合制游戏,许多时候手牌的数量意味着选择的空间和握有的潜在战斗力总和,本身也是一种资源。因此诸如三国杀,炉石传说在内的卡牌游戏会让后手在游戏前期的手牌上占有优势,以此来对冲先手的优势。

同样地,你可以通过调整初始血量,初始金币,初始移动点数等等资源配比来避免先手有着显著的游戏,甚至还可以在先手的计分方式和获胜方式上做出惩罚。


计分惩罚:

这种方法与减少初始资源有着异曲同工的地方,对应的多数也是量化得分的游戏类型。传承千年的经典游戏——围棋,在现代就是使用“贴目”制度(具体数量各地区略有出入),让执黑先行的选手必须比对手多占一部分地盘才能获得本局胜利,来保证先后手的胜率在总体上保持平衡。(如果围棋不贴目,那么黑棋可以通过第一手下天元然后下模仿棋,这样白棋必须制造征子否则无法破解。)

但这种做法有个最显然的问题:你怎么知道具体该惩罚多少分?拍脑门吗?

除此之外还要注意的是,纯粹的量化惩罚与隐式设计(Implicit Game Design)理念有一定冲突,刻意制造了设计师的存在感,让玩家感觉把游戏天平完全建立在了设计师拿捏的一个数值上。这样的规则也会让玩家带着压力开始对局并创造不对称性,破坏整体美感。更好的做法是让两边玩家都清楚自己的初始优势在哪,是多了先行的机会,还是多了选择的空间?


===思路二: “行动不是全部” ===


让先手需要外部资源投入:

带有大量养成玩法的回合制对战游戏中(如Pokemon),许多时候会引入一个“速度”概念,来决定谁会获得先手。这个速度属性是一个特殊的,winner-takes-all的属性,大多数情况下同时也会占用养成的资源,这意味着玩家必须自己做出策略上的选择,是先手给我带来的优势重要,还是让其他硬属性高一些来得重要?这是一种极具趣味,且经过验证可行的玩法,同时也会根据资源比重不同引出一条互相克制的反制链来,与博弈论中“上校赛局”(Blotto Game)相当接近。

(Pokemon中追求速度与否的争辩从未停止)

但是它也有着局限性。“速度”概念是需要外部资源投入的,也就是说必须和外部的养成之类的玩法结合,很难有办法在单局中实现平衡,同时也无法在对称性游戏中实现。毕竟游戏设计上没有完美的事不是么?


增加反制玩法:

上面提到的反制主导的游戏中,有许多是后手具有显著优势的。其原因就是这类游戏中存在策略的相互克制,使得后手方可以学习先手方的策略,并做出针对性的调整来取得优势。那如果把行动主导和反制主导的思想结合起来,让两边都没法占到便宜呢?

在Dota 2职业比赛的英雄选择环节,就使用了类似的做法。双方按2-2-1的次序轮流禁用(ban)特定英雄和选择(pick)特定英雄,如下图:


(从左往右,绿色表示绿方行动回合,红色表示红方行动回合,Ban表示禁用英雄,Pick表示选择英雄)

当然,假设英雄之间只存在绝对的强度差异,那么ban-pick顺序无论怎么调整,先选的一方总是有利的。但Dota 2巧妙的英雄设计让玩家在选择英雄时不仅要考虑强度差异,还有英雄之间的专长协作与克制关系,以及双方对英雄的熟悉程度不同,都会影响ban-pick时的选择。这样一来,职业比赛英雄选择部分就不再是纯粹的先手或运气成分主导,让比赛的观赏性在赛前英雄选择时就得到了充分的渲染。


=== 思路三:“让游戏变得不确定” ===


随机性:

与信息不透明度的思路一样,在游戏中引入随机性可以增加结果的不可预测性,从而降低其与玩家初始先后手状态的关联。但随机性也是一针毒药,用多了会让游戏单纯变成运气,大幅降低游戏策略带来的乐趣。要记住的是,随机性本身并不一定会改变游戏的对称性,但它可以冲淡因对称性带来的一边倒的最优解选择,给最优解的执行带来一定的障碍。


(一个标准卡坦岛游戏的棋盘)

在风靡世界的桌面殖民地建设游戏《卡坦岛》(Settlers of Catan)中,通过投掷两个骰子的点数之和来决定哪些玩家得以获取资源。同时初始两个基地的放置也是按照 从前到后 再 从后到前 的顺序,避免先行玩家对优秀资源点的垄断控制。

另一个提到随机性便不得不说的例子就是《炉石传说》。在炉石中从抽牌到效果发动无时无刻不充斥着随机结果的影响, n抽3再3选1的发现机制也是随机性与决策的结合,更有甚者如尤格萨隆,一张牌随机性的表现在极端情况下便可直接左右比赛的胜负。

在这样的游戏中,随机性使游戏充满了变数,使后手玩家相信先手优势并不可怕,也使每局游戏玩家都有期待。但一如之前所言,过分的随机性会让玩家失去自主感,让游戏的成败变为听天由命的焦虑过程,需要好好把握;另外随机性与反制链的结合不当,也会让游戏变成石头剪刀布那样纯粹开局定胜负的游戏。


挖掘游戏深度:

策梅洛定理假设双方都是“完美的玩家”,但在实际游戏中,先手优势的大小不仅取决于其潜在收益,还得考虑玩家具体能做到多少。这里游戏“深度”一词指得便是技能上的深度,尤其是指即使最优解存在,人类因技能限制也无法达成完美的情况。

举个例子,足球篮球等体育比赛有先手优势吗?足球也是确定性的,信息透明的游戏,但没有人能保证自己能完美控制自己的身体(当然经过训练可以得到提升),球权的更迭很频繁。双方很多时候较量的就是这种身体控制能力,而先获得球权的优势虽然存在,但绝大多数时候并不足以扭转比赛的天平---更何况在半场过后会轮换到另一队开球。

同样地,在国际象棋中,先手的白棋也普遍有着2%-5%的胜率优势。但由于决策树的深度和复杂度,国际象棋先手必胜与否目前还是处于猜想阶段,更别提让人脑去思考和执行了。所以哪怕对先手优势完全没有实质性的平衡手段,国际象棋的平衡也处于玩家普遍可接受的范围内。

(一个X方先行的井字棋游戏的完美平局)

反过来说,深度过浅的游戏先手优势会被放大。比如Tic-tac-toe(井字棋)游戏,因为深度太浅且无随机性,很容易被大多数玩家找到最优解且容易实现。在这种情况下,先手优势不仅很大,而且很容易找到并实现不败策略,因此现在在成年人之间的娱乐对弈活动几乎完全不会考虑井字棋。


延续游戏长度:

某些时候,你已无法直接对游戏规则进行大刀阔斧的改革了,那你怎么进一步对先手优势进行限制呢?

一个办法就是,让大家轮流坐庄,在一定局数之后再判定总体胜负,如同斯诺克比赛那样要打十几局乃至三十几局来决出胜负。这样既可以降低随机性对结果的影响,又可以让先手优势得到压缩。然而缺点是会严重放慢游戏节奏,同时依旧无法对单局比赛的体验产生影响。

除此之外,还能拉长单局游戏的长度,像文明系列那样一局能打几百个回合,让游戏中后期冲淡前期先手的影响(至少是心理影响)。但同样会严重放慢游戏节奏,对不确定性较低的游戏而言还不一定会起到削弱先手的效果。


信息不透明度:

同样是可以用纸笔进行的回合制游戏,带有信息不透明度的Battleship的先手优势就完全不如Tic-tac-toe那么夸张(但是依旧存在)。在Battleship中,由于双方自身的海域布局对对手不可见,玩家需要轮流猜测敌船的摆放位置来进行炮击的选择。



(一个10x10的常见Battleship棋盘,用x标记炮击位置)

显然,如果把Battleship的海域布局改成对双方完全公开的形式,那么这游戏的先手就会变成必胜——先手能先把对方船轰完。但考虑到实际上初始阶段玩家只有大约1/3的概率命中有效目标(事实上与引入了随机性等价),先手就并不能保证对先行优势的转化,只有少数极端情况下先手正好比后手快一步击溃对手才会体现出优势。而这个可以通过一个小小的规则修改来避免,并达成完美对称性:

先手击沉敌人所有船只后,还会允许后手再进行一次炮击;如果后手也因此击沉了敌人所有的船只,则该局计为平局。


=== 延伸阅读:海盗分金与用餐者困境 ===


海盗分金讲述的是多人按顺序分配财产的博弈问题:

有五个理性的海盗,A, B, C, D和E,找到了100个金币,需要想办法分配金币。
海盗们有严格的等级制度:A比B职位高,B比C高,C比D高,D比E高。
海盗世界的分配原则是:
- 等级最高的海盗提出一种分配方案。
- 所有的海盗投票决定是否接受分配,包括提议人。并且在票数相同的情况下,提议人有决定权。
- 如果提议通过,那么海盗们按照提议分配金币。
- 如果没有通过,那么提议人将被扔出船外,然后由下一个最高职位的海盗提出新的分配方案。
海盗们基于三个因素来做决定。
- 首先,要能存活下来。
- 其次,自己得到的利益最大化。
- 最后,在所有其他条件相同的情况下,优先选择把别人扔出船外。

可能很多人都已经见过海盗分金的概念了。最优策略为[98,0,1,0,1]。推理过程可以在百度百科找到:海盗分金_百度百科

这里提出这个概念是为了说明,在足够的空间下,第一个行动的玩家潜在的优势在多人游戏中可以是相当巨大的,尤其是合理利用其他玩家存在的相互竞争关系时。但有的时候,有的游戏规则并不完全等同于海盗分金这样的动态博弈,而是更接近于一个用餐者困境,也就是囚徒困境的多人版:

有若干人出去吃饭,在点菜之前他们达成了一致:
- 所有人平摊买单的钱(AA制)。
- 现在每个人要么点贵的菜肴,要么点便宜的菜肴。
假设贵的菜肴比便宜的要好(即效用高),但是如果一个人单独进食的话,不能保证为贵的菜肴多付的钱一定值得(即性价比低)。
每个人都这么推想:众人将会点便宜的菜肴,而由于点了更贵的菜肴而额外加的钱将被众人摊分,所以额外加的钱是很少的,而菜肴的味道却会有较大的改善,因而多花这点钱是划算的。每个人都这样推想,最后的结果是他们都花钱点了更贵的菜肴,而原本他们认为点便宜的菜肴要比点贵的对每个人都要好些。

在用餐者困境中,假如没有任何信任和交流的建立,每个人都会选择更贵的菜肴,使团体总体上得到损失。究其原因,其实在于决策制定过程的不透明性,假定的是每个人是同时或私下做出点餐决定的。如果我们把它与与海盗分金结合起来看,便可以制定一个新的规则,来解决用餐者困境。

有若干人出去吃饭,在点菜之前他们达成了一致:
- 所有人平摊买单的钱(AA制)。
- 现在每个人要么点贵的菜肴,要么点便宜的菜肴。
- 每个人按次序点菜,点完之后公开自己的选择。
- 所有人可以投票决定是否接受这次选择,如果不接受则将该点餐人排除在外。

假设贵的菜肴比便宜的要好(即效用高),但是如果一个人单独进食的话,不能保证为贵的菜肴多付的钱一定值得(即性价比低)。被众人排除在这次用餐外则是最糟糕的体验,而少一个人一起吃饭也会给团体每个人带来些许的不快。

上述规则事实上并没有做出太大的变化,只是把静态博弈变成了动态博弈,鼓励了信息交流,每个人需要大家的同意才能做出选择。从决策上看,每个人选择便宜菜肴对别人都没有损失,而选择贵的菜肴就要冒潜在的被踢出的风险,单纯地踢出选择便宜菜肴的人对自己也没有收益,因此可以达成的纳什均衡则是唯一的——大家都会选择便宜的菜肴。

同样地,规则设计可以极大程度上左右决策。在多人游戏中,把游戏从海盗分金那样的纯竞争关系的零和博弈改为用餐者困境那样带有合作关系的非零和博弈,并合理掌握信息透明度,可以很大程度上通过合作规则来平衡局面。在War3、帝国时代那样的RTS游戏中进行过多人混战模式的玩家可能还会记得,当一家独大的时候,其他玩家便会考虑群起而攻之。在《卡坦岛》这样的回合制策略游戏中也是一样的道理,在充分自由的交易规则下,玩家可以通过合作和对抗来尝试抵消任何已在游戏中存在的优势。


=== 结语 ===

回合制游戏的先后手平衡有着许多种不同的思路来帮助解决,最重要的还是知道我们的目的是什么:我是要让游戏展现出完美的对称性,还是仅仅需要保证玩家不会因先后手优势问题损伤游戏体验?

其实包括大富翁、飞行棋在内的绝大多数回合制游戏都或多或少具有先手优势,但并没有带来破坏性的影响。上面这些思路许多时候并不一定能完全抹平先手优势影响,也有的在过度使用时会破坏游戏体验,但最重要的是能够合理结合运用,来达成你的目的。

一、前言

在博弈论中存在一个定理:策梅洛定理(Zermelo's theorem)。该定理表示在二人的有限游戏中,如果双方皆拥有完全的资讯,那先行或后行者当中必有一方有必胜/必不败的策略。

该策略也导致了如五子棋等排列较少的游戏出现了先手必胜的情况,包括经典的面试题海盗分金,无一不是对完全信息博弈的验证。然而这种博弈在游戏中势必会破坏玩家的游戏体验,以下为笔者对现有游戏中处理平衡方法的总结及个人思考。

二、后手资源补偿机制 (炉石传说、影之诗)

此种方式主要通过在局内对后手玩家进行额外补偿来缩小先后手差异。

炉石传说其实始终存在先手胜率较高的问题。根据过往资料,炉石传说在测试期间先后手的胜率差异的达到了近八二开。原因也很简单,先手玩家可以先一步进行铺场,也可也先一步使用更高费的卡牌。而将胜率差值逐渐缩小的机制是为后手玩家加入了补偿——硬币。


下面个人分析下硬币行之有效的原因:

    1. 为后手玩家提供有效的反制手段。若玩家为后手且1费时无卡可上,那么在第2回合时会面对先手玩家(1+2)的攻击,而在前期按费拍怪的情况下, 此时后手已经处于较大劣势。但加入硬币后,能够避免后手玩家节奏断档被完全压制。可以提高极端情况下玩家的体验。
    2. 为游戏加入更多节奏变数,丰富游戏玩法。在炉石游戏中,先手玩家除了可以先进行行动外,还有个很大的优势是可以优先使用更高费的卡。而这足以让胜利天平倾斜。但加入幸运币后,后手玩家至少存在一回合可以享受这种优势。同样,硬币牌不仅为额外的水晶,也为法术牌,可以与其他卡牌产生更多的联动效果。同样,影之诗同样也存在类似的机制——后手玩家可以先一回合进化。

三、先后手交换机制(五子棋、MOBA BanPick)

此种方式从本质上来说依旧没有解决先后手的问题,但由于并未引入其他的局内机制,所以使得双方可以轮流使用先后手,同样多局数的设计,也可以看出双方更为明显的实力差距和战术储备。

五子棋三三换手为五子棋官方1989——2007年间官方规定,这种方式允许后手玩家存在场上多一子的情况,避免全场处于被动防守的状态。但允许连续下两子这种设定也往往会带来新的问题:在传统的20多种开局条件种,职业棋手往往只选择其中七种(这也是因为改动不当造成的定式化问题)从而对当时的五子棋环境造成了很大影响。



而moba游戏中——此处特指英雄联盟,职业比赛中,蓝色方往往有更高的胜率。这也是由蓝色方先选所导致的:而为了平衡优先选择强势英雄带来的影响,英雄联盟进行了如下处理:

当玩家处于红色方(后手)时,玩家可以在第一回合选择两个英雄。这就更容易先拿到强势的combo组合,为己方创造优势。

当玩家本局游戏为后手时,下一局可轮换为先手。

个人理解其实这种做法本质上相当于承认了先手的优势地位,同时并不选择延展其他机制来解决先手问题(因为往往无法做出合理的改动),而通过让玩家陆续获得先手机会来保证体验和平衡。同样这种做法适用于变数多、容错大、快节奏的游戏。一方面由于容错大,后手玩家存在获胜机会多;零一方面快节奏的设定允许玩家进行多回合战斗。

四、先手限制机制(游戏王)

游戏王先手玩家第一回合需跳过抽牌阶段和战斗阶段。跳过抽牌阶段使得先手玩家打出OTK的概率降低,而跳过战斗阶段也可以降低前期节奏,从而提升整局游戏的的博弈深度。

同样此类型限制先手的玩法也包括万智牌、三国杀等玩法。同样,由于当前主流卡牌游戏的深度较高,这一定程度上也限制着先手玩家的优势。


五、后手局内反制机制(宝可梦、阴阳师)

宝可梦中献祭类宠物,比如技能临别礼物。在宝可梦等宠物对战中,为玩家提供了明确的后手反制机制:如果然翁配招镜子大衣(反弹2倍特攻伤害)、返拳(反弹2倍物理伤害)、殊途同归(一起死)等技能后手进入战斗,那么很可能会导致先手方改变策略,放弃进攻转而强化自身等操作。


阴阳师早期的PVP生态存在诸多不均衡点,其中很重要的一点就是后手玩家很难给出有效反击。例如早期鬼赤茨木一拳超人,还是雨火,再出现鬼切后的三刀流,无一不标榜着谁拥有着一速,谁就拥有了胜利。此时由于战前策略上玩家存在最优解选择,而战中策略又比较粗暴无脑,往往会导致一速比不过就直接退出游戏的情况出现。

阴阳师进行改进的方式是推出如白藏主之类的式神:白藏主被动技能:自身增加60点的移动速度,而阴阳师中,通过御魂所能增长的速度也不过158点。也就是说玩家只需要做到御魂拥有120以上的练度即可实现稳定的先手,该类防御式神有效的降低了阴阳师的节奏,也避免了OTK局面的出现。但也容易出现新的问题:局内节奏拖沓,玩家体验下降。阴阳师的这种做法属于推出新的版本强势阵容来修复之前版本存在过强阵容的问题,当然这也与其商业游戏定位存在一定的关联。

六、概率先后手机制(梦幻、大话、问道、神武)

第五种为回合制MMO,回合制MMO的出手速度主要通过对战双方的差值来进行概率先手,简单设计一个公式;速度快者的先出手概率为:(A速-B速)/1000+50%,此处仅作为演示,若考虑严谨性需要进行分段设计。


图为MMO回合制游戏问道


也就是说,当玩家A的速度高于玩家B500点以上时,那么A玩家即可做到稳定先手,但当玩家A、B速度属性差值在500点以下时,则B存在小概率先手可能性。这也是一种为了保障玩家体验而设立的巧妙做法。

我们来假设一下若玩家A仅领先B一点速度属性,若没有这种乱速设定会发生什么?

A可以获得无限次的先手机会,B玩家获胜概率为百分之0。同样,B玩家对于速度属性的所有投资收益均归零,而A玩家则获得了所有的收益。所以从博弈的角度来讲,我只需要将我的角色速度比B多一点即可,多2点都是对资源的浪费,等于是给玩家既定了养成的上限。

在添加乱速机制后,A玩家有着50.1的概率先手,而B玩家同样有着49.9的概率先手,这样双方处于一种偏向均衡的状态。同样,从博弈的角度来讲,此时我如果想要达到最优,那么我会尽可能让我的速度面板大于B500点以上,因为这每一点都可以对我带来收益,这种设计也极大拓宽了玩家养成的空间。也对玩家的养成、战斗提供了更为平滑的曲线。


同理拓展思考,为什么网易的阴阳师、宝可梦没有延续这种乱速的设定?

MMO回合制游戏其对属性的强化为主要付费点之一。所以不可能说在强化属性时,存在A的道具属性上限,大于B的道具属性上限的情况。在上限明确确定的情况下,需要存在该机制来保障大部分玩家的利益。

同样对于阴阳师速度来,阴阳师速度通过副本产出,而副本本身不存在付费选项,也不承担付费功能,此时玩家对于这种“意外之财”的接纳程度往往比较高,此时对御魂属性进行随机,可以有效提升游戏的深度和用户时长、黏性。但如果此时再在阴阳师中进行随机会发生什么?玩家的长期投入无法得到明确的回报。且由于差值较小,游戏处于中后期阶段,若有乱速设定将会过于偏袒弱势方。

归根结底,是资源产出方式的不同,导致策划采取了不同的方式来维护玩家的利益。

也是游戏对系统定位的不同,导致的两类游戏分别采用了局外稳定和局内随机,以及局外随机和局内稳定的策略不同。


同理思考前四种机制与后两种模式的差异

此处可以进行思考:为什么后两种模式对后手玩家仅仅是给予了玩法上的反制可能,而非规则上的补偿?因为后两种游戏均存在局外养成机制,玩家的胜利不仅仅取决于局内的策略,也包括局外的养成。所以此时进行过多干预反倒成为了不公平的做法。

七、个人思考

“游戏可以视作一系列有趣的选择。”——席德梅尔

在设计过程中,需要做到的是让游戏变得有趣,给玩家带来更好的体验。而保障游戏竞技过程中基础的平衡,则是有趣的基础,不应作为目的而存在。

同理,如果游戏因为失衡而变得有趣,则也为好的设计。如玩家可以在开始匹配时默认选择为后手方,但在获胜后可以获得更多的积分奖励,一方面可以满足一部分玩家先手更大概率获胜需求,另一方面也满足了部分玩家挑战自我的目的,使其获得更大满足感。