【譯前注:有讀者問ELO等級分體系的說明。觀網上好象沒發現單篇文章就說得通俗清晰的,只好把找到幾篇文章拿在一起合譯互相補充。其間發現具體說法稍有差異,但總的來說概念一致。FIDE已經專門制定計算表了,到時有需要的照套表來算就行了,而且正式等級分表由FIDE統一發布。了解這些基礎概念和函數計算是增進理解。】
ELO等級分體系
主要概念
ELO等級分體系是根據它的推廣者埃洛(elo)教授名字命名的,它是一種以數值表示的體系,將等級差別轉化為分數或取勝概率,反之亦然。當今多數競技項目的等級分體系都是建立在ELO體系之上的。
即使粗略看比賽成績表,也能夠看出選手的表現是有起伏的,也就是有“狀態”之分。強手未必恆定表現好於弱手;每人之狀態在不同的日子不同的比賽里都會有好壞不同。而總的來說整個生涯里每一點上,一名選手的表現將大致圍繞在某個平均水平上下波動,有時會有背離,而出現大背離的情況比出現小背離的情況頻率要低。於是我們有了ELO體系的第一個假定,用標准統計術語表述就是:可以建立這么一個等級量表(rating scale),某個體在這個表里的不同表現將正常分布。
第二個假定牽涉到了等級量表區間間隔的定義。簡單地說,在某一個特定的實力范疇里,盡管可能存在實力上的差異,但總的來說可以預期沒有誰比誰好或差很多。由此可以定量划分區間。
等級量表(rating scale)
ELO體系使用一個叫“區間尺度”(interval scale)的定義,即等級差別是可能性方面的唯一重要因素。【譯注:譯者理解,這是指對陣雙方誰有多大機會勝/負/和,唯一影響因素在於他們之間的等級差別,這樣排除了難以確定的“狀態好壞”(第一假定:個人的總體表現大致是正常分布的),也排除了具體誰對誰的影響(第二假定:某一特定實力范疇里,相互之間的差別一般可預期不會出現太大意外)。因此即使出現“爆冷”或“克星”,也視為偶發情況,因為ELO體系是建立在樣本足夠大量的統計基礎上的。而且個體的等級也是動態反映的。】
有一個概念叫“標准分類間隔”(class interval),簡單說就是某一個等級里最高與最低之間的差別。在國際象棋里,FIDE(即國際棋聯)采用每200分為一個間隔的分類法,並且給每一個間隔取一個名字或排名以更好分辨。 FIDE的等級分分隔表中,將1700分選擇作為普通水平業余棋手的實力值,將2000分選擇作為區分大師與業余者之間的分界線。這個表如下,它足夠大,保證沒有負分出現:
| 等級分 |
實力范疇 |
(另一種說法) |
| 2600以上 |
世界冠軍競爭者;“超一流特級大師” |
世界冠軍競爭者 |
| 2400-2599 |
特級大師(GM);多數國際大師(IM) |
國際等級選手 |
| 2200-2399 |
多數國家大師(FM) |
國家性冠軍決賽選手 |
| 2000-2199 |
候補大師;專家 |
地區性冠軍決賽選手(A級) |
| 1800-1999 |
業余者(A級,范疇1) |
俱樂部B級 |
| 1600-1799 |
業余者(B級,范疇2) |
俱樂部C級 |
| 1400-1599 |
業余者(C級,范疇3) |
俱樂部D級 |
| 1200-1399 |
業余者(D級,范疇4) |
俱樂部E級 |
| 1200以下 |
初學者 |
初學者 |
常態分布函數:
我們知道,強手未必總是勝過弱手,於是就使用一個“常態分布函數”(Normal Distribution Function)來代表一名棋手的波動表現,這是統計學上的概念。從這個函數里可以得出另一個函數叫“常態概率函數”(normal probability function ),這個就定義了根據比賽對抗結果可得出的等級差別,或者根據已知的等級差別可得出的預期比賽對抗結果。它是這樣的:
P(D)這個值,就是以等級分差別D為自變量計算出來的預期取勝可能性(預期得分率),它可近似用下面這個公式來計算:
於是我們可以把典型數值事先都計算出來編成一張表,到時要計算等級分變化時只需查表找出對應數字就是。它叫“百分比預期值表”(Percentage Expectancy Table),簡稱PE表。下面就是兩個PE表,表一從得分率P得出等級分差異D(P);表二則反過來,從等級分差異Rtg Dif得出預期得分率。可見這兩個表是基於同一個公式即“常態概率函數”計算出來的,只不過方向相反,實質一樣。所以可以套公式計算,也可以查表直接得出數字。
| 表一:從得分率得出相應等級分差異 |
|||||||||||
| 得分率(P) |
等級分差異D(P) |
(P) |
D(P) |
(P) |
D(P) |
(P) |
D(P) |
(P) |
D(P) |
(P) |
D(P) |
| 1.00 |
* |
0.83 |
273 |
0.66 |
117 |
0.49 |
-7 |
0.32 |
-133 |
0.15 |
-296 |
| 0.99 |
677 |
0.82 |
262 |
0.65 |
110 |
0.48 |
-14 |
0.31 |
-141 |
0.14 |
-309 |
| 0.98 |
589 |
0.81 |
251 |
0.64 |
102 |
0.47 |
-21 |
0.30 |
-149 |
0.13 |
-322 |
| 0.97 |
538 |
0.80 |
240 |
0.63 |
95 |
0.46 |
-29 |
0.29 |
-158 |
0.12 |
-336 |
| 0.96 |
501 |
0.79 |
230 |
0.62 |
87 |
0.45 |
-36 |
0.28 |
-166 |
0.11 |
-351 |
| 0.95 |
470 |
0.78 |
220 |
0.61 |
80 |
0.44 |
-43 |
0.27 |
-175 |
0.10 |
-366 |
| 0.94 |
444 |
0.77 |
211 |
0.60 |
72 |
0.43 |
-50 |
0.26 |
-184 |
0.09 |
-383 |
| 0.93 |
422 |
0.76 |
202 |
0.59 |
65 |
0.42 |
-57 |
0.25 |
-193 |
0.08 |
-401 |
| 0.92 |
401 |
0.75 |
193 |
0.58 |
57 |
0.41 |
-65 |
0.24 |
-202 |
0.07 |
-422 |
| 0.91 |
383 |
0.74 |
184 |
0.57 |
50 |
0.40 |
-72 |
0.23 |
-211 |
0.06 |
-444 |
| 0.90 |
366 |
0.73 |
175 |
0.56 |
43 |
0.39 |
-80 |
0.22 |
-220 |
0.05 |
-470 |
| 0.89 |
351 |
0.72 |
166 |
0.55 |
36 |
0.38 |
-87 |
0.21 |
-230 |
0.04 |
-501 |
| 0.88 |
336 |
0.71 |
158 |
0.54 |
29 |
0.37 |
-95 |
0.20 |
-240 |
0.03 |
-538 |
| 0.87 |
322 |
0.70 |
149 |
0.53 |
21 |
0.36 |
-102 |
0.19 |
-251 |
0.02 |
-589 |
| 0.86 |
309 |
0.69 |
141 |
0.52 |
14 |
0.35 |
-110 |
0.18 |
-262 |
0.01 |
-677 |
| 0.85 |
296 |
0.68 |
133 |
0.51 |
7 |
0.34 |
-117 |
0.17 |
-273 |
0.00 |
* |
| 0.84 |
284 |
0.67 |
125 |
0.50 |
0 |
0.33 |
-125 |
0.16 |
-284 |
|
|
| 表二:從等級分差異得出相應預期得分率 |
|||||||||||
| 等級分差異 |
高分者預期得分率 |
低分者預期得分率 |
等級分差異 |
高分者預期得分率 |
低分者預期得分率 |
等級分差異 |
高分者預期得分率 |
低分者預期得分率 |
等級分差異 |
高分者預期得分率 |
低分者預期得分率 |
| 0-3 |
0.50 |
0.50 |
92-98 |
0.63 |
0.37 |
198-206 |
0.76 |
0.24 |
345-357 |
0.89 |
0.11 |
| 4-10 |
0.51 |
0.49 |
99-106 |
0.64 |
0.36 |
207-215 |
0.77 |
0.23 |
358-374 |
0.90 |
0.10 |
| 11-17 |
0.52 |
0.48 |
107-113 |
0.65 |
0.35 |
216-225 |
0.78 |
0.22 |
375-391 |
0.91 |
0.09 |
| 18-25 |
0.53 |
0.47 |
114-121 |
0.66 |
0.34 |
226-235 |
0.79 |
0.21 |
392-411 |
0.92 |
0.08 |
| 26-32 |
0.54 |
0.46 |
122-129 |
0.67 |
0.33 |
236-245 |
0.80 |
0.20 |
412-432 |
0.93 |
0.07 |
| 33-39 |
0.55 |
0.45 |
139-137 |
0.68 |
0.32 |
246-256 |
0.81 |
0.19 |
433-456 |
0.94 |
0.06 |
| 40-46 |
0.56 |
0.44 |
138-145 |
0.69 |
0.31 |
257-267 |
0.82 |
0.18 |
457-484 |
0.95 |
0.05 |
| 47-53 |
0.57 |
0.43 |
146-153 |
0.70 |
0.30 |
268-278 |
0.83 |
0.17 |
485-517 |
0.96 |
0.04 |
| 54-61 |
0.58 |
0.42 |
154-162 |
0.71 |
0.29 |
279-290 |
0.84 |
0.16 |
518-559 |
0.97 |
0.03 |
| 62-68 |
0.59 |
0.41 |
163-170 |
0.72 |
0.28 |
291-302 |
0.85 |
0.15 |
560-619 |
0.98 |
0.02 |
| 69-76 |
0.60 |
0.40 |
171-179 |
0.73 |
0.27 |
303-315 |
0.86 |
0.14 |
620-735 |
0.99 |
0.01 |
| 77-83 |
0.61 |
0.39 |
180-188 |
0.74 |
0.26 |
316-328 |
0.87 |
0.13 |
超過735 |
1.00 |
0.00 |
| 84-91 |
0.62 |
0.38 |
189-197 |
0.75 |
0.25 |
329-344 |
0.88 |
0.12 |
|
|
|
舉例:一個等級分1950的棋手,她的對手等級分1700分,那么她取勝的機會有多大呢?
等級分差別D=1950-1700=250,代入上面那么近似計算公式,就是:
也就是說,她全取1分的機會有80.8%,大約是81%。事實上,查表2,可得知等級分差別在246-256之間的強手預期取勝可能性就是81%。不用計算,查表即可。
表現等級分/預計等級分公式:
這是ELO體系的第一個公式:Rp = Rc + D(P) (1)
其中:Rp是表現等級分;Rc是(平均)競賽/對手等級分【如對手不止一個,那就要計算平均對手等級分】;D(P)就是以百分比數值P為自變量所得出的等級分差別(這個數字可以從表1中查出來)
這個公式既可用於定期計算等級分,也可以臨時計算。它可用於決定第一次參加與有等級分的對手角逐的棋手的初始等級分。
舉例:
一個棋手分別與1675分和1890分的對手下了兩盤棋。她戰勝1675的,並且與1890的下成和局。那么她的表現等級分是多少?(或者說,面對這兩個對手她的表現究竟有多好?)
解答:
平均競賽等級分Rc=(1675 + 1890)/2= 1783 。勝得1分,和得0.5分,於是她兩盤得了1.5分,或者說得了75%的分,所以可從PE表中查找75%相應的值(當然,也可以從上面那個函數倒計算出精確值)。根據公式(1):
Rp = Rc + D(P) = 1783 + D(75%) = 1783 + 191 = 1974,這就是她在這兩盤棋的實際表現。
當前等級分公式/連續計量法:
上面所說的公式(1),即表現等級分公式,假如用在一個長時期里,就不能精確反映棋手的實力了。更精確的方法是把各表現等級分綜合計算以盡可能正確反映棋手的當前實力。所形成的數字就叫棋手等級分(player rating)或簡稱等級分(rating)。當然也會有些偶然變數,但沒有表現等級分那么明顯。
這就使用了ELO體系的第二個公式:Rn = Ro + K * (W - We) (2)
其中:Rn是賽事后的新等級分;Ro是賽事前的原等級分;K是單局得分的等級分點值,它是一個系數,取值有約定的;W是實際對局得分(勝得1、和得0.5);We是在原等級分基礎上的預期對局得分。
這個公式是用來在連續基礎上(也就是每局或每個賽事之后)計算新等級分的。它把最新的表現調整考慮進先前的等級分中。它的邏輯意義是一個棋手的表現高於他的預期得分以及低於他的預期失分。
系數K決定了事前等級分和本次表現分的相應權數。K值越高,那么越近的賽事表現的分量越大。反之則反之。一般K值范圍從10到32。下面是一個K取值參考表:
| 等級分 |
K值 |
| < 2000 |
30 |
| 2000-2400 |
130-R/20 |
| > 2400 |
10 |
預期對局得分We是每局預期得分的總和,面對每一個對手的取勝可能性P(D)從表2查出來然后把它們加總,公式就是:We = Σ(Pi) (3) 【譯注:Σ即是sigma,西格馬,即數學上的求總和】
舉例:
一個棋手等級分1650,比賽中她分別與等級分為2050、1270和1550的三個對手對了陣,戰勝了低分的兩個,逼和了最高分的那個。她的新等級分是多少?
解答:
K值取10;Ro=1650;W = 勝2和1 = 1 + 1 + 0.5 = 2.5
We = P(1650 - 1270) + P(1650 - 1550) + P(1650 - 2050) 【注意是對取勝可能性求總和】
=0.910 + 0.638 + (1-0.921)
=1.627
套入公式(2),即Rn = Ro + K * (W - We) = 1650 + 10 * (2.5 - 1.627) = 1659
也就是她在這次賽事后,等級分升了大約9分,成為1659。
當前等級分可以每一盤之后隨時計算,但最終結果一致。
| 對手 |
等級分 |
等級分差異 |
預期得分率(請您計算或查表) |
| 1 |
2500 |
-150 |
|
| 2 |
2480 |
-130 |
|
| 3 |
2430 |
-80 |
|
| 4 |
2400 |
-50 |
|
| 5 |
2375 |
-25 |
|
| 6 |
2365 |
-15 |
|
| 7 |
2335 |
+15 |
|
| 8 |
2320 |
+30 |
|
| 9 |
2300 |
+50 |
|
| 10 |
2280 |
+70 |
|
| 11 |
2260 |
+90 |
|
| 總計 |
26045 |
-195 |
|
最后把原文一的例子稍作改動變成例題,有興趣者可解答:有一棋手等級分是2350,她參加12人的聯賽,其它11名對手的等級分如表,等級分差別也列出來了;她比賽成績是5勝6負;K值取32。請依次計算以下數值:
1)查表或計算對每個對手各自的預期得分率;
2)計算(平均)對手等級分Rc;
3)根據成績計算她的(實際)得分百分比值,然后查表並使用公式(1)計算這個聯賽里她的表現等級分Rp;
4)查PE表列出這個表中對每個對手分別的取勝可能性值,並把它們求總和得出預期對局得分We;
5)根據公式(2)計算本次比賽后她的新等級分;
參考答案請點擊這里。
出處: (見原文)
譯者: michael
類型: 合編譯
