|
关于lehman
rating的计算
这篇文章类似于那篇描述我的第一个评分系统(采用不同的权重方法)的文章。评分系统的大多数目标是一致的,但实现方法不同,新系统更简单,更精确。
目前,OKBridge对所有的牌局都就均等分,也就是,它假设牌手的水平是一样的,它未设置任何补偿分数。一个牌手的平均分数,在一般的情况下,仅仅能粗略地显示他的水平。
一个公平的个人评分系统应该能够用百分比来精确地反映个人的水平等级,不管他的对手和搭档的情况如何。也就是说,无法通过和好的牌手搭档去对付水平低的对手的方式提高自己的分数等级,也没有必要担心在好的牌手中奋战(相应地学习到更多的桥牌技能)会降低自己的分数等级。
个人百分比等级的含义是:一个R%等级的牌手,和一个同等水平的牌手做搭档,与平均等级为(100-R)%的牌手对垒,可以获得R%的比赛分。举个简单的例子,两个54%的牌手和两个46%的牌手对垒,长期来说,54%的一对可以赢得54%的比赛分。(也许两个牌手的平均水平应该用几何平均数,而不是用算术平均数,采用几何平均数给予弱的牌手更多的权重,他的错误会把他们这一对的分数拉下得更多(好牌手的不幸!)。不管如何,以下的计算均采用算术平均,假定每位牌手做出关键性决定的机会是一样的)
任何一个具有R%等级的牌手,和三个具有绝对平均水平的牌手打牌时,如果四个牌手都以他们个人的水平在打牌,那么这个牌手应该能得到一个相应的比赛分。以下式计算: 我们的水平/(对手的水平+我们的水平)或(50+R)/(50+50+50+R)
自然,击败弱的牌手更为容易。评分系统应该反映这一点。最简单的方法是给予弱的牌手一个补偿分数来减少他们与其预期水平的差距。如果他们打的特别好(与他们的能力相比),而好的牌手水平发挥一般或发挥低于其水平,弱的牌手就赢得了比赛,尽管他们的均等分低于50%。同时,障碍并未使牌手们平等,这相当于惩罚好的牌手仅仅因为他们水平高!
不管怎样,评分系统应该奖励好的牌手。桥牌是合作和沟通的游戏。只有坐庄与搭档没关系。(提高水平的最好途径是和比自己强的牌手打牌)而且和一个差的搭档叫牌和防守要比和一个好的搭档难得多。搭档越糟,桥牌就越不是搭档的游戏。个人的分数等级应该反映牌手和任何搭档打牌的能力,不管他们水平如何。
在OKBridge中,一盘可能是一副牌,可能是几十副牌。评分系统无法知道一盘比赛的长度,把相关?
呐凭滞骋豢悸恰M保械谋热趾虸MP都是在一个时间段内进行计算的,直到每周的周末才能全部算完。打牌时能采取的最好方式是给弱的牌手一个非正式的补偿分数,以便所有四个牌手能立刻知道在目前的组合下他们的得分。
周末,当所有牌局分数计算完毕,评分系统也完成了个人的周平均得分和年平均得分。这是引入决定每个牌手个人分数等级(与总平均得分有关,但并不等于)的绝好时机。这样的一个系统在每个牌局中都根据搭档和对手的相对水平,考虑到个人的分数等级。
评分系统的数学假设: 1.当对垒强的对手时,一个好的结果价值更高。当差劲的防守者犯了一个愚昧的错误,给你一个超墩时,你不能得到顶分。你只有在发现一个唯一的防守路线去威胁高明的庄家时,才确实能得到顶分。
2.从统计角度来看,一个好的结果应更多地归因于好的牌手做了一个好的决定。因而好的牌手应该得到更高的分数。
3.从统计角度来看,一个坏的结果应更多地归因于差劲的牌手犯了一个错误。因而差劲的牌手应该得到更低的分数。
4.
如果一个牌手在一盘或一局比赛中得到他赢得的分数,他的个人等级就应该不变。我的第一个评分系统和目前采用的均等分系统,并未考虑这个问题。当四个55%的牌手在一个桌子上打牌时,如果结果的比赛分为50%,评分系统就不应该调整任一牌手的等级。同样地,四个40%地牌手无法提高他们的等级仅仅因为他们在一起打牌。同时,系统应该对所有牌手公平,不管其对手是否相称。
5.
有这些调整都必须精确,以保证从统计结果来说,每位牌手得到的奖分与其在牌局中的表现相称。
6.
在决定个人等级时,牌手的最近表现应该得到更多的权重。等级应该表明牌手目前的水平,并能够预测其未来的水平。
7.
调整的方式应该相对简单,易于实现。一个回归系统是最简单的,因为以前的牌局不用重新分析,仅仅需要一个穿过结果的回归线。在一个合理的短暂时间内,一个牌手的分数等级应该能迅速地趋近他的实际水平。
8.
最后的评分系统应该能鼓励不同水平的牌手在一起打牌,而评分系统能公平地给每个人和他的搭档评分。好的和差的牌手不应互相避免。
9.评分系统不应减少打牌的乐趣,不应影响到打牌的策略或搭档/对手的选择。
10.
牌手获胜的数学期望值仍然可以通过选择最好的搭档来达到最高,但其差距不象在均等记分系统下那么大。(数学期望值=奖励X
获胜的概率)对任一牌手来说,理想的搭档是一个专家,或是一个水平虽然稍低,但风格相配,能达到1+1>2效果的牌手。评分系统当然假设专家是理想的牌手。并且专家不用害怕和新手搭档,为了补偿其损失的获胜几率,奖励提高了。
11.
一个“摇摆”的比赛(有很多顶分和底分)应该对弱的牌手更有利,也就是,弱的牌手能获得超过他们等级的分数。在高水平的锦标赛时,好的牌手不应去赌输赢除非急需大的得分。合理的策略是:避免灾难,等对手送礼物,在长期的比赛中占优。 ===========================================================================
单个牌局的建议调整准则: A.继续在比赛分制和IMP制的牌局中沿用均等积分系统。每个牌手的MP和IMP百分比等级分为两个不同的实体,用于将来的计分和给予非正式的补偿分数。
B.评分系统是一个经过改进的,对牌手个人技能的估计:R%。它每周自动调整以趋近牌手的长期的获胜概率。
C.每周在增加新的牌局分数之前,每位牌手累计牌局数分数中的6.7%将被舍弃(取整),同时保留总平均分。通过这种方式,使每周新的牌局记分占比相应比例更高的比重。6.7%是按照牌手总分的半衰期为10周(0.933^10=0.5)得出的(如果他不打新的牌局)。所以,牌手如果每周有规律地打牌,他的等级分数会更稳定。注意等级百分比不受影响,牌手的正式累计分也不受影响。仅仅是采用正式累计分的一个拷贝来用于此套评分系统。
D.这个系统,与第一个系统不同,与牌局是否“平”没有关系,它是基于牌手在表中的预期得分的。预期得分是一对牌手在和一对给定对手打牌时所应得到的比赛分,如果四位牌手都发挥了他们的水平的话。计算公式如下:南北的预期得分是:(北的等级分+南的等级分)/(北的等级分+南的等级分+东的等级分+西的等级分) 一些例子,两个55%的牌手和两个45%的牌手打牌,预期得分公式是110/200,即55%。 如果四个牌手是:N
(52%), S (61%), E (54%), W (41%), 南北的预期得分是113/208,即54.3%;东西的预期得分当然就是45.7%。 E.
一场比赛中非正式地显示在屏幕上的每个结果都会乘以(强的一对牌手分数/弱的一对牌手分数)的平方根。上面例子中,南北的预期得分54.3%;东西的预期得分45.7%。东西的预期得分乘上补偿系数(113/95)的平方根,得到49.84%,略低于50%。所以如果两对牌手都正常发挥水平,南北会获胜;但如果东西赢得49%的比赛(超过他们的预期水平),他们就会“获胜”。
F.在每副牌的基础得分均等地计算出后,每对搭档都会得到相应比例的MP或IMPs。例如,四个牌手N
(52%), S (61%), E (54%), W
(41%),假设南北在100个比赛分中赢得63个,现有的系统会给每个人相等的分数:南北各得63,东西各得37。在新系统中,南北的得分(126)按南北的等级分比例(52:61)分配,东西也一样,所以 北得到126
X (N/(N+S))=57.98;南得到68.02;东得到42.06;西得到31.94。注意搭档间水平差别越大,好牌手得到的分数比例就越大。另外,四个牌手的总得分依然是200。
G.最后,把四位牌手的得分乘上一个常数使其标准化,得到一个与牌手等级相对应的分数。同样的牌局对四个好的牌手比对四个新手价值更高,与这两个牌局在系统中是否完全相等没有关系。其结果仅影响这四个牌手。这个常数等于(北的等级+南的等级+东的等级+西的等级)/200。在上面的例子中,所有得分乘上208/200。实际上等于每个牌手以自己的等级分数在牌局上下注。在一个有四个55%牌手的牌桌上,每局牌都价值220比赛分。同样,在一个有四个40%牌手的牌桌上,每局牌价值160比赛分。这里提供一些例子(在读者的左边用于验证)来说明如果一个牌手在牌局上得到他的预期分数,他就能拿回他的“赌注”而他的总平均分数保持不变。
H.IMP等级分可以计算为MP百分比,先把IMP分数粗略地转化为相应的比赛分。我试用过不同的公式,想得到一个合理的,与MP等级分相对应的等级分布(也就是,当对大量的牌局记分时,不管采用MP还是IMP,结果是相近的)目标是如果一个牌手在两种记分体系中打得一样好(很少牌手是这样的),他在两种体系中的得分应该非常相近。根据经验,下面的公式似乎可行:-7.5到7.5的IMP得分可以线性转化为相应的0-100的MP分数,超过7.5的IMP得分视为顶分;低于-7.5的得分视为底分,任何一对牌手,不管他们输掉多少IMP,也不会得到负的比赛分。所以,任何原始的IMP得分乘上(50/7.5)再加50得到相应的比赛分;任何高于100的视为100,低于0的视为0。 举个例子,四个牌手:N
(52%), S (61%), E (54%),
W(41%)。南北得到3.4IMP。相当于72.67MP,东西得27.33。此比赛分在一对牌手中按比例分配:北得到66.88,南得到78.46,东得到31.07,西得到23.59;乘以标准化常数(208/200),最后得分是:北
69.56,南81.60,东32.31,西24.53。南北获胜的几率为54.3%,转换为(4.3 X
(7.5/50))=0.645IMP。
I.牌手的等级分(牌手的平均成绩)不可能低于25%或高于75%。这限制了在补偿对手和在搭档之间分配分数时的过分波动。
J.百分比等级转换成粗略的离散数字,牌手的等级在表中显示。表中列出(随机排列)所有牌手的等级。(或是旁观者的等级,如果没有足够的打牌者的话)诸如“有经验的”或是“中级的”的自评等级,由于没有一个标准,将从表中除去。
K.10级是平均水平,对应百分比等级为50%的牌手。新来的牌手将被列入平均水平(接近50%)直到他打了足够的牌局(目前是10局)来更准确地决定他的水平。当然,转换到一个新的等级不会在一周内发生,只能在周末,统计完所有牌局和计算过所有得分后才以进行。
L.等级范围从1(低于31%)到20(高于75%),分布在50%左右。大致与在人群中的分布情况相对应。 M.目前的等级为: 1
under 31% 6 45-46.99 11
51-51.99 16 60-62.99 2 31-35.99 7
47-47.99 12 52-52.99 17 63-66.99 3
36-39.99 8 48-48.99 13
53-54.99 18 67-70.99 4 40-42.99 9
49-49.99 14 55-56.99 19 71-74.99 5
43-44.99 10 50-50.99 15
57-59.99 20 75%
up 因为评分系统本身是线性分布的(我的第一个系统不是),这些等级对称地分布在等级10左右,(除了超过60的等级分,需要调整以对应多出来等级“20”)。没有等级0,正如我的第一个系统,没有人希望得到这种评价!
N.
整个评分系统不影响个人实际的每周和每年的结果和平均分,这些分数一直被保存直到被使用。等级百分比,点数,和牌局总得分形成了一个完备的系统,从不同方面(更公平地)给牌手的水平予评价。这本质上是一个单独的程序,仅仅是每周提供关于一个牌手的一对数据给全球牌手服务系统(GPS)。这些数据在每个牌手的统计屏上和等级条上显示。同时GPS还使用这些数据来计算表中二级记分列中的非正式补偿分数(用来给予弱的牌手一个公平的获胜机会的分数) ===========================================================================
最后,要注意下列原则: a.目前的均等记分系统假设所有牌手的等级为50,正如新系统中给新牌手的等级 b.不管结果如何,牌手自动地比弱的搭档得到更高的分数。这好比和收费一个客户打牌,客户支付少量的费用以提高获胜的可能性。也可以认为是给好的牌手一点分数来补偿因为弱的搭档所造成的较差的结果。 c.
任何牌手,如果其搭档赢得期望分数,他就能得到与其相对应的分数。 d.
所有这些分数不再在任何给定的牌局中表示“在MP赛制中的百分比得分”,而是表示根据牌手以他的水平,高于其水平,或低于其水平给这个牌手的奖分或罚分。因此,在这个系统中,这些桌的结果不能直接和其他类似桌的结果相比。 =========================================================================== 以上是翻译的文章,下面是debi总结出来,实用于yaBridge的计算方式 具体算法: 1. 每个人有一个牌技指数
25.0 - 75.0
(低于25按25计算,高于75按75计算),初始状态为50。(OKB中还使用了1-20级对此指数做了量化,转换表见后) 2. 每一副牌,首先将IMP得分转换为MP得分(0-100),公式为:IMP
* 50/7.5 + 50,高于7.5IMP的算100分,低于-7.5IMP的算0分。 3. 每个人此副牌的得分为: MP 得分 *
2 * (自己的牌技指数)/ (自己的牌技指数 + 同伴的牌技指数) 4. 此得分乘以牌局价值(四个人的牌技指数之和 /
200)为每个人这一局的最后得分。 5. 每周统计:累计分数 = 旧得分 * 93.3 % +
新得分之和 牌技指数
= 累计分数 /
总局数 (a:
总局数中也要扣除原来局数的6.7%) (b:
6.7%是以10周为半衰期计算,即假如一个牌手不打新牌,10周后他的累计分数只有原来的1/2,但平均分即牌技指数不变)
改进的算法是:如果牌手1周不打牌,他的分数和副数都保持不变,这是容易理解的,牌手的停止打牌应该视为牌手的水平没有任何的下降或提升。
|