Sistem peringkat Elo

Arpad Elo, pencipta sistem peringkat Elo

Sistem peringkat Elo adalah suatu metode untuk menghitung tingkat keterampilan (skill) relatif pemain pada permainan jumlah-nol (zero-sum) seperti catur dan go. "Elo" sering ditulis dengan huruf kapital (ELO), tetapi bukanlah suatu akronim. Elo berasal dari nama penciptanya, Arpad Elo, ahli fisika Amerika Serikat kelahiran Hungaria.

Sistem Elo diciptakan sebagai perbaikan sistem peringkat catur dari sistem Harkness yang digunakan sebelumnya.[1] Tapi sistem ini juga digunakan sebagai sistem peringkat dalam sepak bola, sepak bola Amerika (American football), bisbol, bola basket, pool, tenis meja, dan banyak permainan papan dan olahraga elektronik (esports).

Peringkat (rating) Elo seorang pemain dinyatakan dengan sebuah poin angka yang mungkin berubah, bergantung pada hasil pertandingan yang dimainkan. Pada setiap akhir pertandingan, pemenang akan mengambil poin dari yang kalah. Perbedaan peringkat antar dua pemain menentukan banyaknya poin yang didapat atau yang hilang dari sebuah pertandingan. Dua pemain dengan peringkat yang sama diprediksi (expected) akan mendapatkan total jumlah kemenangan yang sama, jika peringkat keduanya sama. Pemain dengan peringkat 100 poin lebih tinggi daripada lawannya diprediksi menang 64%; jika 200 poin lebih tinggi, ia diprediksi mendapatkan 76%. Dengan cara pandang lain, pemain dengan peringkat tinggi hanya mendapat sedikit poin ketika menang dari pemain peringkat-rendah. Tapi pemain dengan peringkat-rendah akan mendapatkan banyak poin jika menang dari pemain peringkat-tinggi (dan sedikit poin jika hasil pertandingannya seri/imbang). Hal ini mengakibatkan sistem peringkat Elo self-correcting. Pemain dengan peringkat terlalu tinggi atau terlalu rendah, dalam jangka panjang akan berubah naik-turun menyesuaikan prediksi sistem peringkat sampai nilai peringkat menggambarkan kemampuan asli pemain tersebut.

Peringkat Elo hanya bersifat komparatif (untuk dibandingkan), dan hanya dapat dibandingkan dalam lingkungan pemain tempat peringkat tersebut dihitung (rating pool); Peringkat Elo tidak dapat digunakan untuk mengukur kemampuan absolut seorang pemain.

Sejarah

Arpad Elo adalah seorang pemain catur tingkat master dan peserta aktif dalam Federasi Catur Amerika Serikat (USCF) sejak didirikan pada tahun 1939.[2] USCF menggunakan sistem peringkat numerik, yang dirancang oleh Kenneth Harkness, yang memungkinkan para anggotanya mengukur kemampuan masing-masing; selain dengan melihat total menang dan kalah dalam turnamen. Sistem Harkness cukup adil, tetapi dalam beberapa situasi memunculkan peringkat yang dianggap tidak akurat oleh banyak pengamat. Atas nama USCF, Elo merancang sistem baru dengan dasar statistika yang lebih baik.[3] Pada waktu yang hampir bersamaan, György Karoly dan Roger Cook secara independen mengembangkan sistem berdasarkan prinsip yang sama untuk Asosiasi Catur New South Wales.[4]

Sistem Elo yang didasarkan pada estimasi statistika menggantikan sistem penghargaan kompetitif. Pada sistem lawas ini, poin penghargaan suatu turnamen olahraga disesuaikan dengan evaluasi subjektif atas 'kehebatan' pencapaian tertentu. Sebagai contoh, memenangkan turnamen golf internasional mungkin bernilai lima kali lipat lebih banyak poin daripada memenangkan turnamen nasional. Sebaliknya, estimasi statistika menggunakan model yang menghubungkan hasil pertandingan dengan variabel-variabel dasar yang mewakili kemampuan setiap pemain. Asumsi utama Elo adalah bahwa performa catur setiap pemain dalam setiap pertandingan adalah variabel acak yang terdistribusi secara normal. Meskipun seorang pemain mungkin tampil lebih baik atau lebih buruk secara signifikan dari satu permainan ke permainan berikutnya, Elo mengasumsikan bahwa nilai rata-rata dari penampilan pemain tertentu hanya berubah secara perlahan dari waktu ke waktu. Elo menganggap kemampuan pemain yang sebenarnya sebagai rata-rata dari variabel acak performa pemain tersebut.

Asumsi lebih lanjut diperlukan karena performa catur dalam cara pandang di atas masih belum dapat diukur. Seseorang tidak dapat melihat urutan gerakan catur dan mendapatkan angka yang mewakili keterampilan pemain tersebut. Performa hanya dapat disimpulkan dari kemenangan, seri, dan kekalahan. Oleh karena itu, jika seorang pemain memenangkan permainan, mereka diasumsikan telah tampil di level yang lebih tinggi daripada lawannya dalam permainan tersebut. Sebaliknya, jika pemain kalah, mereka diasumsikan tampil di level yang lebih rendah. Jika permainan berakhir seri, kedua pemain diasumsikan tampil pada level yang hampir sama. Elo tidak menjelaskan secara pasti seberapa dekat dua pertandingan agar dianggap seri, bukan menang atau kalah.

Untuk menyederhanakan komputasi lebih jauh, Elo mengusulkan metode yang mudah untuk memperkirakan variabel dalam modelnya (yakni, keterampilan sebenarnya dari setiap pemain). Seseorang dapat menghitung dengan relatif mudah dari tabel berapa banyak permainan yang diharapkan akan dimenangkan oleh pemain berdasarkan perbandingan peringkat mereka dengan peringkat lawan. Peringkat pemain yang memenangkan lebih banyak permainan dari yang diharapkan akan meningkat, sedangkan pemain yang memenangkan lebih sedikit dari yang diharapkan akan menurun peringkatnya. Selain itu, perubahan peringkat tersebut harus sesuai (linear) dengan jumlah kemenangan pemain yang melebihi atau kurang dari jumlah yang diharapkan.[5]

Dari perspektif modern, asumsi penyederhanaan Elo tidak diperlukan karena daya komputasi saat ini tidak mahal dan tersedia secara luas. Beberapa orang, terutama Mark Glickman, telah mengusulkan untuk menggunakan metode statistika yang lebih canggih untuk memperkirakan variabel yang sama. Di sisi lain, kesederhanaan komputasi sistem Elo telah terbukti menjadi salah satu aset terbesarnya. Dengan bantuan kalkulator saku, seorang kompetitor catur yang memiliki informasi yang cukup dapat menghitung dengan tepat berapa peringkat mereka yang akan dipublikasikan secara resmi, yang membantu mendorong persepsi bahwa peringkat tersebut adil.

Penerapan sistem Elo

USCF menerapkan saran-saran Elo pada tahun 1960,[6] dan sistem Elo dengan cepat mendapatkan pengakuan sebagai sistem yang lebih adil dan lebih akurat daripada sistem peringkat Harkness. Sistem Elo diadopsi oleh Federasi Catur Dunia (FIDE) pada tahun 1970.[7] Elo menjelaskan karyanya secara rinci dalam buku The Rating of Chessplayers, Past and Present, yang pertama kali diterbitkan pada tahun 1978.[8]

Uji-uji statistik selanjutnya menunjukkan bahwa performa catur hampir pasti tidak terdistribusi secara normal, karena pemain yang lebih lemah memiliki peluang menang yang lebih besar daripada yang diperkirakan oleh model Elo.[9][10] Pada praktiknya, hanya ada sedikit perbedaan antara bentuk kurva logistik dan kurva normal. Jadi, tidak masalah apakah distribusi logistik atau normal yang digunakan untuk menghitung skor yang diharapkan.[11] Namun, secara matematis, fungsi logistik lebih mudah digunakan.[12] FIDE tetap menggunakan tabel selisih peringkat seperti yang diusulkan oleh Elo.[13]

Sistem-sistem peringkat Elo yang diterapkan

Istilah "Peringkat Elo" sering digunakan untuk merujuk pada peringkat catur seorang pemain yang dihitung oleh FIDE. Namun, penggunaan ini dapat ambigu karena ide-ide umum Elo telah diadopsi oleh banyak organisasi, termasuk USCF (sebelum FIDE), banyak federasi catur nasional lainnya, Professional Chess Association (PCA); juga server-server catur daring, seperti Internet Chess Club (ICC), Free Internet Chess Server (FICS), dan Yahoo! Games. Setiap organisasi memiliki implementasi yang unik, dan tidak ada satupun yang mengikuti saran asli Elo dengan tepat.

Sebagai gantinya, peringkat Elo disertai informasi mengenai organisasi yang memberikan rating. Sebagai contoh: "Pada Agustus 2002, Gregory Kaidanov memiliki peringkat FIDE 2638 dan peringkat USCF 2742." Peringkat Elo dari berbagai organisasi ini tidak selalu dapat dibandingkan secara langsung, karena peringkat Elo mengukur hasil dalam suatu kelompok pemain catur dan bukan kemampuan absolut dari semua pemain catur.

Pemeringkatan FIDE

p {\displaystyle p} d p {\displaystyle d_{p}}
1.00 +800
0.99 +677
0.9 +366
0.8 +240
0.7 +149
0.6 +72
0.5 0
0.4 −72
0.3 −149
0.2 −240
0.1 −366
0.01 −677
0.00 −800

Peringkat performa (performance rating, PR) adalah peringkat dugaan yang dihasilkan dari permainan-permain pada hanya satu acara/turnamen. Beberapa organisasi catur[14]:p. 8 menggunakan "algorithm of 400" untuk menghitung peringkat performa. Berdasarkan algoritma ini, peringkat performa untuk sebuah acara dihitung dengan cara berikut:

  1. Untuk setiap kemenangan: tambahkan peringkat lawan dan tambahkan dengan 400,
  2. Untuk setiap kekalahan: tambahkan peringkat lawan dan kurangkan dengan 400,
  3. Untuk setiap hasil seri: tambahkan peringkat lawan,
  4. Lalu bagi total perhitungan diatas dengan banyaknya permainan yang terjadi.

Sebagai contoh, seorang pemain yang menang melawan orang dengan peringkat w dan orang dengan peringkat x, namun kalah dari pemain dengan peringkat y dan seri ketika melawan orang dengan peringkat z, akan mendapatkan peringkat performa

P R = ( w + 400 ) + ( x + 400 ) + ( y 400 ) + z 4 = w + x + y + z + 400 ( 2 ) 400 ( 1 ) 4 {\displaystyle {\begin{aligned}PR=&{\frac {(w+400)+(x+400)+(y-400)+z}{4}}\\[6pt]=&{\frac {w+x+y+z+400(2)-400(1)}{4}}\end{aligned}}}

Algoritma ini adalah sebuah penyederhanaan, namun memberikan cara mudah untuk memperkirakan besar peringkat performa.

FIDE, di lain pihak, menghitung peringkat performa sebagai: rerata peringkat lawan-lawan ditambahkan dengan perbedaan peringkat. Perbedaan peringkat d p {\displaystyle d_{p}} didapatkan dari tabel dengan menentukan skor persentase p {\displaystyle p} pemain dalam turnamen. Skor persentase ini dihitung sebagai total poin yang didapat lalu dibagi dengan banyaknya permainan yang dilakukan. Sebagai catatan, skor sempurna atau tanpa skor memiliki d p = 800. {\displaystyle d_{p}=800.} Tabel diruas kanan adalah versi sederhana dari tabel yang disertakan dalam manual FIDE.[15]

Peringkat saat ini

FIDE memperbarui daftar peringkatnya pada setiap awal bulan. Di lain pihak, peringkat saat ini (live ratings), yang tidak resmi, menghitung perubahan peringkat pemain setiap akhir permainan. Peringkat ini didasarkan pada pemeringkatan yang FIDE publikasikan, sehingga live rating seorang pemain dimaksudkan untuk mengetahui berapa peringkat yang akan dihasilkan jika FIDE memperbarui daftar peringkatnya di hari itu.

Teori

Perbandingan perpasangan (pairwise comparisons) menjadi dasar metodologi pemeringkatan Elo[16]. Lebih spesifik, besarnya performa disimpulkan dari banyaknya menang, kalah, dan seri, ketika melawan pemain-pemain lain. Peringkat seorang pemain bergantung pada peringkat dari lawan-lawan mereka dan skor yang dihasilkan dari melawan mereka. Perbedaan peringkat antar dua pemain menentukan perkiraan skor harapan (expected score) antara keduanya; hal ini akan dijelaskan lebih lanjut. Besarnya rerata dan jangkauan dari pemeringkatan dapat dipilih sembarang. USCF awalnya berniat agar pemain klub catur yang umum, akan memiliki peringkat 1500. Elo selanjutnya menyarankan penskalaan pada pemeringkatan, agar perbedaan peringkat catur sebesar 200 poin mengartikan pemain yang lebih kuat memiliki skor harapan (dengan kata lain skor rata-rata yang diharapkan) sekitar 0,75.

Skor harapan seorang pemain adalah peluang menang pemain tersebut ditambah setengah dari peluang ia menghasilkan seri. Akibatnya, skor harapan sebesar 0,75 mengartikan 75% peluang menang, 0% peluang seri, dan 25% peluang kalah. Di sisi ekstrem yang lain, skor ini juga dapat mengartikan 50% peluang menang, 50% peluang seri, dan 0% peluang kalah. Peluang hasil seri tidak didetailkan dalam sistem Elo: hasil seri dianggap setengah menang dan setengah kalah.

Secara praktik, karena kemampuan asli dari setiap pemain tidak dapat ditentukan, skor harapan diukur menggunakan skor pemain saat itu, sebagai berikut: jika pemain A memiliki peringkat R A {\displaystyle \,R_{\mathsf {A}}\,} dan pemain B memiliki peringkat R B {\displaystyle \,R_{\mathsf {B}}\,} , rumus (menggunakan kurva logistik dengan basis 10)[17] skor harapan untuk pemain A adalah

E A = 1 1 + 10 ( R B R A ) / 400   . {\displaystyle E_{\mathsf {A}}={\frac {1}{1+10^{(R_{\mathsf {B}}-R_{\mathsf {A}})/400}}}~.}

Serupa dengan itu, skor harapan untuk pemain B adalah

E B = 1 1 + 10 ( R A R B ) / 400   . {\displaystyle E_{\mathsf {B}}={\frac {1}{1+10^{(R_{\mathsf {A}}-R_{\mathsf {B}})/400}}}~.}

Rumus tersebut dapat pula dituliskan sebagai

E A = Q A Q A + Q B {\displaystyle E_{\mathsf {A}}={\frac {Q_{\mathsf {A}}}{Q_{\mathsf {A}}+Q_{\mathsf {B}}}}}

dan

E B = Q B Q A + Q B   , {\displaystyle E_{\mathsf {B}}={\frac {Q_{\mathsf {B}}}{Q_{\mathsf {A}}+Q_{\mathsf {B}}}}~,}

dengan Q A = 10 R A / 400 , {\displaystyle \;Q_{\mathsf {A}}=10^{R_{\mathsf {A}}/400}\;,} dan Q B = 10 R B / 400   . {\displaystyle \;Q_{\mathsf {B}}=10^{R_{\mathsf {B}}/400}~.} Bentuk terakhir ini mengartikan bahwa E A + E B = 1   . {\displaystyle \;E_{\mathsf {A}}+E_{\mathsf {B}}=1~.} Dengan mengamati pembilang, skor harapan untuk pemain A adalah Q A / Q B {\displaystyle \;Q_{\mathsf {A}}/Q_{\mathsf {B}}\;} lebih besar dari skor harapan untuk pemain B. Dapat disimpulkan pula untuk setiap perbedaan 400 poin dibandingkan lawan, skor harapan pemain meningkat 10 kali lipat dibandingkan skor harapan lawan.

Ketika skor seorang pemain dalam suatu turnamen melebihi skor harapan, sistem Elo menyimpulkan peringkat pemain tersebut terlalu rendah dan perlu ditingkatkan. Sebaliknya, jika skor seorang pemain dalam turnamen lebih rendah dari skor harapan, peringkat pemain akan diturunkan. Usulan Elo yang asli, yang masih umum digunakan, adalah menyesuaikan skor secara linear dengan perbedaan performa yang terjadi di turnamen dari yang skor harapan. Penyesuaian maksimum untuk setiap permainan, yang disebut dengan faktor-K, ditetapkan sebesar K = 16 {\displaystyle \;K=16\;} untuk master dan K = 32 {\displaystyle \;K=32\;} untuk pemain yang lebih lemah.

Misalkan pemain A (yang memiliki peringkat R A {\displaystyle R_{\mathsf {A}}} ) diharapkan mendapatkan skor E A {\displaystyle \,E_{\mathsf {A}}\,} poin namun pada kenyataannya mendapatkan S A {\displaystyle \,S_{\mathsf {A}}\,} poin. Rumus untuk memperbarui peringkat pemain tersebut adalah

R A = R A + K ( S A E A )   . {\displaystyle R_{\mathsf {A}}'=R_{\mathsf {A}}+K\cdot (S_{\mathsf {A}}-E_{\mathsf {A}})~.} [18]

Pembaruan ini dapat dilakukan pada akhir setiap permainan, akhir setiap turnamen, atau akhir suatu periode pemeringkatan yang sesuai.

Berikut adalah sebuah contoh untuk memperjelas:

Misalkan pemain A memiliki peringkat 1613 dan bermain dalam sebuah turnamen lima-ronde. Ia kalah pada pemain berperingkat 1609, seri melawan pemain berperingkat 1477, menang melawan pemain berperingkat 1388, menang melawan pemain berperingkat 1586, dan kalah melawan pemain dengan peringkat 1720. Skor asli dari pemain adalah (0 + 0.5 + 1 + 1 + 0) = 2.5 . Sedangkan skor harapan yang dihitung dengan rumus diatas, adalah (0.51 + 0.69 + 0.79 + 0.54 + 0.35) = 2.88.

Artinya, peringkat baru pemain adalah [1613 + 32·(2.5 − 2.88)] = 1601 , mengasumsikan faktor-K sebesar 32 digunakan.

Walaupun dua menang, dua kalah, dan satu seri terlihat sebagai hasil yang imbang, keadaan ini lebih buruk dari skor harapan pemain A karena peringkat lawan-lawan mereka rata-rata lebih rendah. Akibatnya, peringkat player A sedikit turun. Andaikan pemain A mendapatkan dua menang, satu kalah, dan dua seri -- dengan total skor tiga poin --, ia bermain sedikit lebih baik dari harapan. Peringkat pemain A dalam kasus ini akan menjadi [1613 + 32·(3 − 2.88)] = 1617 .

Prosedur pembaruan ini menjadi dasar pemeringkatan yang digunakan oleh FIDE, USCF, Yahoo! Games, Internet Chess Club (ICC) dan Free Internet Chess Server (FICS). Akan tetapi, setiap organisasi menggunakan cara yang berbeda untuk mengurus ketidakpastian terkait pemeringkatan; khususnya peringkat untuk setiap pemain baru, dan masalah inflasi/deflasi pada pemeringkatan. Para pemain baru mendapatkan peringkat sementara (provisional) yang diperbaiki lebih drastis ketimbang pemain dengan peringkat yang sudah pasti.

Prinsip-prinsip dalam sistem peringkat Elo dapat digunakan untuk pemeringkatan pada cabang kompetisi yang lain, seperti pertandingan sepak bola internasional. Sistem Elo juga telah diterapkan pada permainan tanpa kemungkinan hasil seri, dan pada permainan yang memiliki besar perbedaan hasil akhir (selain sekadar menang/kalah).

Usulan-usulan modifikasi

Pada tahun 2011 setelah menganalisis 1,5 juta permainan FIDE, Jeff Sonas menunjukkan sembarang dua pemain yang memiliki perbedaan peringkat sebesar X {\displaystyle X} menurut rumus Elo, ternyata memiliki perbedaan peringkat sekitar 5 6 X . {\textstyle {\frac {5}{6}}X.} Hal ini mengartikan para pemain secara konsisten kehilangan poin ketika menang, karena rumus Elo salah memprediksi hasil.[19]

Masalah matematis pertama yang diangkat oleh USCF adalah penggunaan distribusi normal. USCF menemukan bahwa hal ini tidak secara akurat mewakili hasil aktual yang terjadi, terutama oleh para pemain yang berperingkat lebih rendah. Sebagai gantinya, mereka beralih ke model distribusi logistik, yang menurut USCF lebih sesuai dengan hasil yang terjadi.[20][butuh rujukan] FIDE juga menggunakan pendekatan distribusi logistik.[13]

Masalah kedua adalah besar faktor-K perlu digunakan. Ahli statistika catur Jeff Sonas percaya bahwa nilai K = 10 {\displaystyle K=10} (untuk pemain dengan nilai di atas 2400) yang diterbitkan Elo tidak akurat. Jika koefisien faktor-K ditetapkan terlalu besar, akan ada terlalu banyak sensitivitas pada beberapa kejadian terbaru, dalam artian besarnya poin yang dipertukarkan dalam setiap permainan. Dan jika nilai K terlalu rendah, sensitivitasnya akan menjadi minimal, dan sistem tidak akan merespons dengan cukup cepat terhadap perubahan tingkat performa pemain yang sebenarnya. Estimasi faktor-K asli yang dilakukan Elo tidak mengikutkan basis data yang besar dan bukti-bukti statistik. Sonas menyimpulkan faktor-K sebesar 24 (untuk pemain dengan peringkat diatas 2400) dapat lebih akurat karena lebih sensitif terhadap performa, dan dapat dipakai sebagai alat prediktif mengukur performa di masa depan.[21]

Beberapa situs catur daring sepertinya menghindari penetapan tiga-level faktor-K yang ditentukan dari kelompok peringkat. Sebagai contoh, ICC terlihat mengadopsi nilai K = 32 {\displaystyle K=32} yang global, kecuali ketika bermain melawan pemain dengan peringkat sementara (provisional). Di lain pihak, USCF (yang menggunakan distribusi logistik ketimbang distribusi normal) awalnya menetapkan faktor-K berdasarkan tiga kelompok peringkat berikut:

  • K = 32 {\displaystyle \;K=32\;} untuk peringkat di bawah 2100,
  • K = 24 {\displaystyle \;K=24\;} untuk peringkat di antara 2100 dan 2400, dan
  • K = 16 {\displaystyle \;K=16\;} untuk peringkat diatas 2400.

Saat ini USCF menggunakan sebuah rumus yang menghitung faktor-K berdasarkan beberapa faktor, seperti banyaknya permainan yang pernah dilakukan dan peringkat pemain saat ini. Besar faktor-K juga diperkecil bagi pemain peringkat tinggi jika turnamen menggunakan kontrol waktu yang singkat.[14] Sedangkan, FIDE menggunakan jangkauan peringkat berikut:[22]

  • K = 40 {\displaystyle \;K=40\;} untuk pemain baru, sampai akhir turnamen dan total 30 permainan; juga untuk setiap pemain sampai ulang tahun ke-18, selama peringkat mereka di bawah 2300,
  • K = 20 {\displaystyle \;K=20\;} untuk pemain yang peringkatnya selalu dibawah 2400,
  • K = 10 {\displaystyle \;K=10\;} untuk pemain dengan sembarang peringkat setidaknya 2400 dan telah bermain setidaknya 30 permainan pada turnamen sebelumnya. Besar nilai K ini permanen setelah pemain mendapatkannya.

Penurunan formal untuk permainan menang/kalah

Rumus Elo dapat dihasilkan dengan menggunakan hubungan peringkat Elo dan stochastic gradient update dalam regresi logistik.[23][24] Jika kita mengasumsikan hasil permainan bersifat biner, yakni hanya dapat mengobservasi menang atau kalah, maka permasalahan pemeringkatan dapat diselesaikan lewat regresi logistik. Dalam hal ini, hasil permainan adalah variabel terikat dari variabel bebas berupa peringkat pemain, dan model yang menghubungkan keduanya bersifat probabilistik. Peluang pemain A {\displaystyle {\mathsf {A}}} memenangkan permainan dimodelkan sebagai

Pr { A   menang } = σ ( r A , B ) , σ ( r ) = 1 1 + 10 r / s , {\displaystyle \Pr\{{\mathsf {A}}~{\textrm {menang}}\}=\sigma (r_{\mathsf {A,B}}),\quad \sigma (r)={\frac {1}{1+10^{-r/s}}},}

dengan r A , B = ( R A R B ) {\textstyle r_{\mathsf {A,B}}=(R_{\mathsf {A}}-R_{\mathsf {B}})} menyatakan perbedaan peringkat antara dua pemain, dan dengan menetapkan faktor penskala s = 400 {\displaystyle s=400} . Menggunakan hukum total peluang,

Pr { B   menang } = 1 σ ( r A , B ) = σ ( r A , B ) . {\displaystyle \Pr\{{\mathsf {B}}~{\textrm {menang}}\}=1-\sigma (r_{\mathsf {A,B}})=\sigma (-r_{\mathsf {A,B}}).}

Besar kerugian logistik (log loss) selanjutnya dihitung sebagai

= { log σ ( r A , B ) jika   A   menang , log σ ( r A , B ) jika   B   menang , {\displaystyle \ell ={\begin{cases}-\log \sigma (r_{\mathsf {A,B}})&{\textrm {jika}}~{\mathsf {A}}~{\textrm {menang}},\\-\log \sigma (-r_{\mathsf {A,B}})&{\textrm {jika}}~{\mathsf {B}}~{\textrm {menang}},\end{cases}}}

menggunakan stochastic gradient descent, fungsi kerugian tersebut diminimumkan lewat:

R A R A η d d R A R B R B η d d R B {\displaystyle {\begin{aligned}R_{\mathsf {A}}\leftarrow R_{\mathsf {A}}-\eta {\frac {{\textrm {d}}\ell }{{\textrm {d}}R_{\mathsf {A}}}}\\R_{\mathsf {B}}\leftarrow R_{\mathsf {B}}-\eta {\frac {{\textrm {d}}\ell }{{\textrm {d}}R_{\mathsf {B}}}}\end{aligned}}} .

dengan η {\displaystyle \eta } menyatakan besar langkah adaptasi. Karena d d r log σ ( r ) = log 10 s σ ( r ) {\textstyle {\frac {\textrm {d}}{{\textrm {d}}r}}\log \sigma (r)={\frac {\log 10}{s}}\sigma (-r)} , d r A , B d R A = 1 {\textstyle {\frac {{\textrm {d}}r_{\mathsf {A,B}}}{{\textrm {d}}R_{\mathsf {A}}}}={1}} , dan d r A , B d R B = 1 {\textstyle {\frac {{\textrm {d}}r_{\mathsf {A,B}}}{{\textrm {d}}R_{\mathsf {B}}}}=-1} , adaptasi dapat dituliskan sebagai

R A { R A + K σ ( r A , B ) jika   A   menang R A K σ ( r A , B ) jika   B   menang , {\displaystyle R_{\mathsf {A}}\leftarrow {\begin{cases}R_{\mathsf {A}}+K\sigma (-r_{\mathsf {A,B}})&{\textrm {jika}}~{\mathsf {A}}~{\textrm {menang}}\\R_{\mathsf {A}}-K\sigma (r_{\mathsf {A,B}})&{\textrm {jika}}~{\mathsf {B}}~{\textrm {menang}},\end{cases}}}

yang secara lebih ringkas dapat dinyatakan sebagai

R A R A + K ( S A E A ) {\displaystyle R_{\mathsf {A}}\leftarrow R_{\mathsf {A}}+K(S_{\mathsf {A}}-E_{\mathsf {A}})}

dengan K = η log 10 / s {\displaystyle K=\eta \log 10/s} adalah langkah adaptasi baru yang menyerap η {\displaystyle \eta } dan s {\displaystyle s} , S A = 1 {\displaystyle S_{\mathsf {A}}=1} jika A {\displaystyle {\mathsf {A}}} menang dan S A = 0 {\displaystyle S_{\mathsf {A}}=0} jika B {\displaystyle {\mathsf {B}}} menang. Skor harapan bagi pemain A {\displaystyle {\mathsf {A}}} didapatkan dari E A = σ ( r A , B ) {\displaystyle E_{\mathsf {A}}=\sigma (r_{\mathsf {A,B}})} . Serupa dengan itu, pembaruan untuk peringkat R B {\displaystyle R_{\mathsf {B}}} adalah

R B R B + K ( S B E B ) {\displaystyle R_{\mathsf {B}}\leftarrow R_{\mathsf {B}}+K(S_{\mathsf {B}}-E_{\mathsf {B}})} .

Referensi

Catatan kaki

  1. ^ Elo, Arpad E. (August 1967). "The Proposed USCF Rating System, Its Development, Theory, and Applications" (PDF). Chess Life. XXII (8): 242–247. 
  2. ^ Redman, Tim (July 2002). "Remembering Richard, Part II" (PDF). Illinois Chess Bulletin. Diarsipkan dari versi asli (PDF) tanggal 2020-06-30. Diakses tanggal 2020-06-30.  Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
  3. ^ Elo, Arpad E. (March 5, 1960). "The USCF Rating System" (PDF). Chess Life. USCF. XIV (13): 2. 
  4. ^ Elo 1986, p. 4
  5. ^ Elo, Arpad E. (June 1961). "The USCF Rating System - A Scientific Achievement" (PDF). Chess Life. USCF. XVI (6): 160–161. 
  6. ^ "About the USCF". United States Chess Federation. Diarsipkan dari versi asli tanggal 2008-09-26. Diakses tanggal 2008-11-10.  Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
  7. ^ Elo 1986, Preface to the First Edition
  8. ^ Elo 1986.
  9. ^ Elo 1986, ch. 8.73.
  10. ^ Glickman, Mark E., and Jones, Albyn C., "Rating the chess rating system" (1999), Chance, 12, 2, 21-28.
  11. ^ "Deloitte Chess Rating Competition". Diarsipkan dari versi asli tanggal 2011-08-30. Diakses tanggal 2011-09-05.  Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
  12. ^ Glickman, Mark E. (1995), "A Comprehensive Guide to Chess Ratings". A subsequent version of this paper appeared in the American Chess Journal, 3, pp. 59–102.
  13. ^ a b FIDE Rating Regulations effective from 1 July 2017. FIDE Online (fide.com) (Laporan). FIDE. Diarsipkan dari versi asli tanggal 2019-11-27. Diakses tanggal 2017-09-09.  Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
  14. ^ a b The US Chess Rating system (PDF) (Laporan). April 24, 2017. Diarsipkan dari versi asli (PDF) tanggal 7 February 2020. Diakses tanggal 16 February 2020 – via glicko.net.  Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
  15. ^ "B. Permanent Commissions / 02. FIDE Rating Regulations (Qualification Commission) / FIDE Rating Regulations effective from 1 July 2017 till 31 December 2021 (with amendments effective from 1 February 2021) / FIDE Handbook". International Chess Federation (FIDE) (dalam bahasa Inggris). Diakses tanggal 2023-02-01. 
  16. ^ Elo 1986, ch. 1.12.
  17. ^ Elo 1986, p. 141, ch. 8.4& Logistic probability as a rating basis
  18. ^ Elo August 1967.
  19. ^ https://en.chessbase.com/post/the-elo-rating-system-correcting-the-expectancy-tables
  20. ^ Elo 1986, ch. 8.73
  21. ^ "The Sonas Rating Formula – Better than Elo?". Chess News (dalam bahasa Inggris). 2002-10-22. Diakses tanggal 2023-01-13. 
  22. ^ FIDE Rating Regulations effective from 1 July 2014. FIDE Online (fide.com) (Laporan). FIDE. 2014-07-01. Diarsipkan dari versi asli tanggal 2014-07-01. Diakses tanggal 2014-07-01.  Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
  23. ^ Kiraly, F.; Qian, Z. (2017). "Modelling Competitive Sports: Bradley-Terry-Elo Models for Supervised and On-Line Learning of Paired Competition Outcomes". arXiv:1701.08055. 
  24. ^ Szczecinski, Leszek; Djebbi, Aymen (2020-09-01). "Understanding draws in Elo rating algorithm". Journal of Quantitative Analysis in Sports (dalam bahasa Inggris). 16 (3): 211–220. doi:10.1515/jqas-2019-0102. ISSN 1559-0410. 

Sumber

  • Elo, Arpad (1986). The Rating of Chessplayers, Past and Present (edisi ke-Second). New York: Arco Publishing, Inc. ISBN 978-0-668-04721-0.  Parameter |orig-date= yang tidak diketahui akan diabaikan (bantuan)

Bacaan lebih lanjut

  • Harkness, Kenneth (1967). Official Chess Handbook. McKay. 

Pranala luar

  • (Inggris) Chessgraphs.com - Compare chess players' rating histories with FIDE data back to 1970
  • (Inggris) Arpad Emre Elo – 100th anniversary
  • (Inggris) Official FIDE Rating List
  • (Inggris) GoBase.org: Introduction to the Elo Rating System
  • (Inggris) Citations for Elo, A.E. 1978. The Ratings of Chess Players: Past and Present.[pranala nonaktif permanen]
  • (Inggris) Mark Glickman's research page, with a number of links to technical papers on chess rating systems
  • (Inggris) FIDE's Top 100 players
  • (Inggris) http://chess.about.com/library/weekly/aa03a25.htm Diarsipkan 2008-07-08 di Wayback Machine.
  • (Inggris) A site that ranks national soccer teams using Elo methods
  • (Inggris) A site that makes use of the BCF performance rating system for provisional rating assessment followed by the Elo rating system after that
  • (Inggris) EGF Official Ratings Diarsipkan 2006-08-14 di Wayback Machine.
  • (Inggris) Jeff Sonas: The Sonas Rating Formula — Better than Elo?
  • (Inggris) Eloquery with worldrankinglist and historical development since 1990
  • (Inggris) National Scrabble Association ratings Diarsipkan 2008-10-14 di Wayback Machine.
  • (Inggris) The Elo-rating system used for Tantrix Diarsipkan 2008-10-04 di Wayback Machine.
  • l
  • b
  • s
Garis besar
  • Teori catur
  • Gelar catur
    • Grandmaster
    • Daftar grandmaster
  • Catur komputer
    • glosarium
    • pertandingan
    • mesin
    • perangkat lunak
  • Catur korespondensi
  • FIDE
  • Glosarium
  • Sejarah
    • linimasa
    • permainan terkenal
  • Sistem rating
    • peringkat dunia
    • norma
  • Varian
    • daftar
  • Rekor dunia
Perlengkapan
Peraturan
  • Rokade
  • Sekak
  • Sekakmat
  • Seri
    • dengan kesepakatan
    • Aturan 50 langkah
    • Sekak berulang
    • Remis
    • Pengulangan tiga kali
  • En passant
  • Promosi bidak
  • Kontrol waktu
    • Catur cepat
  • Aturan sentuh-jalan
Istilah
  • Blunder
  • notasi catur
    • aljabar
    • deskriptif
    • PGN
    • simbol anotasi
    • simbol Unicode
  • Fianchetto
  • Gambit
  • Kotak kunci
  • Raja berjalan
  • Bidak
    • terbalik
    • terhubung
    • ganda
    • terisolasi
    • Maróczy Bind
    • terlewati
  • Kolom terbuka
    • Kolom setengah terbuka
  • Pos depan
  • Aliran
    • romantik
    • hipermodernisme
  • Mengecoh
  • Tempo
  • Transposisi
  • Jebakan
Taktik
  • Baterai
    • Meriam Alekhine
  • Blok
  • Pola skakmat
  • Kombinasi
  • Umpan
  • Defleksi
  • Desperado
  • Discovered attack
  • Sekak ganda
  • Garpuan
  • Interferensi
  • Overloading
  • Pin
  • Pengorbanan
  • Tusukan
  • Undermining
  • Windmill
  • X-ray
  • Zwischenzug
Strategi
  • Rokade buatan
  • Kompensasi
  • Pertukaran
    • the exchange
  • Inisiatif
    • Keuntungan langkah pertama
  • Permainan tengah
  • Gempuran bidak
  • Struktur bidak
  • Nilai buah
  • Profilaksis
Pembukaan
Pembukaan sayap
Permainan Bidak Raja
  • Pertahanan Alekhine
  • Pertahanan Caro–Kann
  • Pertahanan Prancis
  • Pertahanan Modern
  • Pertahanan Nimzowitsch
  • Permainan Terbuka
    • Permainan Italia
    • Pembukaan Semi-Italia
    • Piano Giuoco
    • Gambit Raja
    • Pertahanan Petrov
    • Pertahanan Philidor
    • Ruy Lopez
    • Permainan Skotlandia
  • Pertahanan Owen
  • Pertahanan Pirc
  • Pertahanan Skandinavia
    • Gambit Tennison
  • Pertahanan Sisilia
    • Alapin
    • Naga/Naga yang Dipercepat
    • Najdorf
    • Scheveningen
Permainan Bidak Menteri
  • Pertahanan Belanda
  • Pertahanan India
    • Pertahanan Benoni
    • Benoni Modern
    • Pertahanan Bogo-India
    • Pertahanan Grünfeld
    • Pertahanan India Raja
    • Pertahanan Nimzo-India
    • Pertahanan India Menteri
  • Serangan Trompowsky
  • Sistem London
  • Gambit Menteri
    • Diterima
    • Ditolak
    • Pertahanan Slavia
    • Pembukaan Katalan
Lainnya
  • Daftar pembukaan
    • Tabel teori
  • Daftar gambit catur
  • Tidak beraturan
  • Sekakmat cepat
    • Fool's mate
    • Scholar's mate
Permainan akhir
  • Skak gajah dan kuda
  • Raja & bidak vs raja
  • Gajah bersebrangan warna
  • Tanpa bidak
  • Menteri & bidak vs ratu
  • Menteri vs bidak
  • Benteng & gajah vs benteng
  • Benteng & bidak vs benteng
    • Posisi Lucena
    • Posisi Philidor
  • Strategi
    • Perbentengan
    • oposisi
    • Peraturan Tarrasch
    • Triangulaasi
    • Zugzwang
  • Kajian
  • Tabel permainan akhir
  • Permainan akhir dua kuda
  • Gajah yang salah
  • Bidak benteng yang salah
Turnamen
  • Daftar turnamen catur kuat
  • Olimpiade Catur
    • Perempuan
  • Kejuaraan Catur Dunia
    • Daftar
    • Turnamen Kandidat
    • Piala Dunia Catur
    • FIDE Grand Prix
  • Kejuaraan dunia lainnya
    • Perempuan
    • Tim
    • Cepat
    • Kilat
    • Junior
    • Pemuda
    • Senior
    • Amatir
    • Komposisi catur
    • Pemecahan
    • Catur komputer
    • Catur cepat komputer
    • Mesin catur
Terkait
  • Kecurangan dalam catur
  • Estetika catur
  • Catur dalam seni
    • dalam literatur awal
  • Buku catur
    • Buku pembukaan
    • Literatur permainan akhir
  • Tinju catur
  • Klub catur
  • Komposer catur
  • Catur di Eropa
    • Göttingen manuscript
  • Perpustakaan catur
  • Kategori:Museum catur
  • Kolom koran catur
  • Majalah catur
  • Permasalahan catur
    • glosarium
    • lelucon catur
  • Prodigi catur
  • Gökyay Association Chess Museum
  • Deep Blue
  • Papan catur terpotong
  • PRO Chess League
  • Ekshibisi serentak
  • Pemecahan catur
  • Set catur Staunton
  • Set catur Dubrovnik
  • Perbandingan pecatur top