/【雷火UX带你聚焦GDC2021】数据驱动的洲际对战匹配(W3Champions.com:Andrea Locatelli)

【雷火UX带你聚焦GDC2021】数据驱动的洲际对战匹配(W3Champions.com:Andrea Locatelli)



网易雷火UX用户体验中心编译,转载需注明本公众号
什么是GDC?
GDC是全球最高影响力的游戏开发者会议,每年在旧金山召开一次,已有35届。虽然一周会议的门票售价高达2千美元,仍有多达27000名业界人士现场出席,可见其价值与权威性。GDC重头环节是非赞助类主题演讲,每届主办方平均邀请不足300场,分核心与峰会两大类别。这些演讲人经过主办方及其全球顾问委员会的精心挑选邀请,以高质量和创新性而备受行业认可,一定程度代表游戏行业的当前最高水准与发展趋势。
2020年起,受COVID-19影响,改由线上形式。2021年的GDC大会于7月19日至23日举办。雷火UX共在GDC2021获邀11场演讲,领跑全球。

每年的GDC大会上,全球顶尖的游戏开发者们将齐聚在这里,交流彼此的想法,构想游戏业的未来方向。接下来雷火UX公众号会选择一部分高质量的演讲,陆续为大家进行介绍。旨在通过对这些演讲内容进行学习,了解游戏领域的最新研究热点趋势,并期待与全世界的游戏爱好者一起产生更多创新和灵感的碰撞。


GDC 2021

Andrea Locatelli

Online Game Technology Summit

演讲标题:

Data Driven Competitive Matchmaking Over Multiple Continents

演讲者信息:

Andrea Locatelli是一名数学博士同时也是一名魔兽世界的半职业选手,目前是社区项目W3Champions的数据科学家。

演讲内容:

1. 魔兽争霸3的历史、W3Champions社区项目的由来;
2. W3Champions中匹配算法的优化,包括排名公式的设计,针对2v2随机组队的优化;
3. 洲际天梯上服务器选择的优化,它可以保证洲际玩家之间的对战在ping值上是接近的,以此来保证公平。

01
魔兽争霸3和W3Champions项目
魔兽争霸3是一款风靡全球的即时战略游戏(Real Time Strategy Game),发布于2002年7月,它最受欢迎的模式有1v1,2v2,4v4和FFA。从Dota游戏的崛起还可以看出,这款游戏有着充满活力的自定义游戏场景。暴雪在2020年1月份发布了《魔兽争霸3:重制版》,并引起了巨大的轰动,很多前职业玩家也回到游戏中,目前在欧洲、中国、韩国非常活跃。
但是,游戏初始版本的匹配机制无法让玩家找到有竞争性的对手,这就意味着一个新玩家可能会遇到游戏里的前职业选手,或者有着20年经验的游戏玩家,这会造成游戏的双方都无法获得良好的游戏体验,并因此对游戏的这个版本感到失望。
在这个时候,一个叫做W3Pad的社区开发者决定做一个匹配平台来解决这一问题。他在过去的几年时间里,为魔兽争霸3的生态做了大量的贡献。这个匹配平台是基于Chromium嵌入框架来显示菜单的。你需要做的就只是下载这些文件,因为它可以直接整合到你的游戏文件里面。然后在游戏中,你就可以直接访问它。
W3Champions的界面如下图所示:

进入游戏后,你可以点击W3Champions的按钮,选择游戏的模式如(1on1),你希望使用的种族,然后点击FIND MATCH按钮就可以自动寻找匹配的对局,并开始游戏。最终,游戏的结果会自动发送到数据库。这意味着,玩家不需要做除了玩游戏之外其它额外的工作,如记录游戏结果。

02
如何改进排名公式?
当玩家通过W3Champions进行游戏匹配时,可以获取到所有的玩家匹配数据,那么作者是如何利用对局最终的结果来改进系统,从而优化玩家的游戏体验呢?
作者在改进计算排名公式中所遵循的主要的原则就是平衡玩家的技能水平和活跃度。可以将其归纳为两个方面:
1、公平(Fair):如果每个人参与了大量的对局,排名公式应该是一个收敛到比较纯技能水平的公式。这意味着只要你知道玩家参与了“足够“的对局,那么只对玩家的技能水平进行排名就是公平的,因为你已经对这些玩家获取到了足够的样本量来评估他们的技能水平。
2、活跃度(Honest):如果排名公式以某种方式鼓励你尽可能多的参与对局,就意味着在第一条原则中,作者试图收敛到依靠技能水平的排名是正确的。那么,可以近似地将原则二的结果看成满足原则一的前提条件。
最终作者得到的排名公式为:

其中,参数用来权衡玩家的技能水平与活跃度,参数是用来衡量“足够“多对局的标准。可以看出,当玩家获胜场次不断增加时,你可以获得的收益是不断减少的,最终公式的前半部分:

会收敛到1。公式的右边用来计算玩家的技能水平,表示玩家的积分,表示置信度,用来量化积分的不确定程度。当左边的公式收敛到1时,公式只与玩家的积分有关,从而满足了关于公平的设计原则。
03
2v2匹配机制的优化
2v2随机组队的算法在实际操作中存在着一些挑战:
1、挑选评分邻近的玩家并不意味着公平。这是因为,为了保证公平,你总会把评分最高的和评分最低的玩家放在一起组队。例如,当有3个水平较高的玩家和一个水平较差的玩家时(评分分别为1904,1903,1902,1701),对于评分1904的玩家来说是不公平的,因为他会跟1701组队。
2、如何对队伍的整体水平建模?用队伍成员评分的平均数是一个常用的模型,但是可能会有这样的例子:对于两个评分为2000和1200的队伍和两个评分为1600和1600的队伍,他们的平均分是相同的。然而这两只队伍的水平可能并不在一个水准,因为在这款游戏中,低水平的玩家可能会托高水平玩家的后腿。在游戏中,对方可能会不断对低水平的对手施加压力,持续的获取收益并最终获取游戏的胜利。
3、玩家在游戏里的水平是长尾型分布的。这意味着高水平玩家可能只占玩家群体的2%,但是他们可能会最积极的,且掌握了最高的话语权。单纯取悦这部分玩家可能会忽略掉更广大玩家群体的意见。
在匹配玩家时,作者会尽量在公平(Fairness)、统一(Uniformity)、等待时间(Wait Time)之间寻找平衡。其中,公平意味着玩家获胜的概率是50%。统一,表示匹配到的玩家之间水平相近,公式表示为:

为了保证公平性,根据现有的文献以及作者的直觉,团队的水平可以表示为一个广义的p均值:

整个公式的值跟p的大小有关,可以看出当p=1时,就是求玩家的积分均值。为了获得一个更好的p值,作者通过对游戏的对战历史做极大似然估计,最终得出p=-0.02时,用于2v2匹配是最合适的。那么获胜的概率可以表示为:

其中g为缩放后的逻辑函数,与Glicko2和Elo一致。
如果对玩家的积分分成间隔一致的分段,可以看出玩家呈现一个正态分布,那么对于玩家人数较少的区间,匹配所用的时长可能会增加。而增加区间的跨度,会使得同一区间玩家的水平差距较大,影响游戏体验。所以,这样的划分方式不够好。

作者最后选择了加权经验累计分布函数(weighted empirical cumulative distribution function, 简称WECDF) 作为划分玩家区间的方法,对于一个评分小于玩家P的玩家比例,按其出场次数加权。以玩家在排队序列中的分布可以看出,每个区间玩家的数量是均匀的,因此保证了匹配的统一(Uniformity)。

有了公平和统一的定义,那么整个匹配问题可以表示一个数学定义,即对于所有可能的对局,当且仅当满足下列条件时是可以被选择的:

通过对历史数据进行实验,最终确定了参数的大小。

04
洲际天梯的服务器优化
1v1模式的玩家会分布在各个大洲,对于高水平玩家来说,由于同一大洲且同等级的玩家数量较少,经常需要匹配到其他大洲的玩家。由于官方的服务器只部署在芝加哥、阿姆斯特丹、首尔,这导致其他大洲的玩家网络延迟很高。为此,一个叫做fluxxu的开发者创建了Flo,这可以将服务部署在任何地方。
现在,根据所有对战玩家在不同服务器上的ping值,就可以从服务器列表中挑选出最优的服务器,计算的公式为:

但这可能会导致对战玩家的一方出现系统性的劣势。因为这种服务器选择方式总是固定的,例如美国东部的玩家对阵欧洲的玩家,由于服务器总是用的纽约的服务器,可能会导致某些欧洲玩家的ping值很高。
为了改进这个缺点,作者尝试去挑选一对服务器,作为待选服务器。每个服务器可以用对玩家的偏向表示:

当且仅当时,符号为正。如果两个服务器A,B的偏向的符号是相反的,意味着这两个服务器各自偏向于其中一个玩家。所以如果混合这两个服务器,那么结果就是公平的。因为假设以一定概率选择其中服务器A表示为:

可以看出玩家有一定概率获得一个偏向自己的服务器,也有一定概率获得对自己不利的服务器,所以总体而言,这种选择对任何一个玩家是公平的。
05
 总  结 
在这篇演讲中,作者分享了魔兽争霸3天梯在匹配上的优化,可以看出优化后的天梯效果显著,在过去的1年时间里,在天梯上进行了超过300万场对战,所有中国、韩国的顶级玩家都使用天梯进行比赛,并在前几个月前成功举办了锦标赛。这些优化不仅局限在一款游戏中,可能会对其他游戏匹配机制的设计带来启发。同时作者将问题抽象为简单数学问题的方法也是值得学习的。

最后欢迎大家投递雷火UX设计面向2022届毕业生的校招岗位

雷火UX商务沟通:grp.leihuoux@corp.netease.com

往期推荐



本文来自微信公众号“网易雷火UX用户体验中心”(ID:LeihuoUX)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。