Le classement Elo et le plaisir de la modélisation

Par Marc-Antoine Dionne

Il n’y a qu’un seul problème statistique vraiment sérieux : c’est de savoir comment évaluer qui est le meilleur aux échecs. Blagues à part,  trouver comment ordonner joueurs selon leurs performances a entraîné la création d’un système statistique d’une étonnante simplicité: le système de classement Elo. Nommé en l’honneur de son créateur, M. Arpad Elo, le système part du principe que les joueurs ont des performances variables. Ils vont parfois très bien jouer et d’autres fois, moins bien jouer, chacun ayant ses bonnes et ses mauvaises parties. Le modèle tient compte de ce phénomène en assumant que la performance des joueurs suit une distribution centrée sur une moyenne, qui est leur classement Elo.

ELO 1

Ainsi, les joueurs peuvent faire des prédictions quant à leurs chances de victoire contre d’autres joueurs en comparant leurs distributions. La fonction de distribution utilisée pour le classement Elo est la fonction logistique qui, ressemble beaucoup à celle de la distribution gaussienne à l’exception prêt que celle-ci à une kurtose, l’épaisseur de sa « queue », plus élevée puisque empiriquement, et particulièrement dans le cas des joueurs amateurs, les évènements extrêmes ont une fréquence assez élevée. Empiriquement, il n’est pas rare aux échecs qu’un joueur d’un calibre plus faible défie les attentes en remportant une partie contre un joueur mieux classé. La distribution logistique est donc plus représentative de la réalité qu’une distribution normale dans ce cas ci.

La prédiction sur la probabilité de victoire entre deux joueurs se calcule avec l’équation suivante :

       ELO 2

Où E_a représente la probabilité de victoire d’un joueur de classement R_a affrontant un joueur de classement R_b. Cette probabilité de victoire correspond à l’aire sous la courbe où les deux distributions se chevauchent. À noter que le choix de la valeur 400 comme écart-type est « arbitraire » dans la mesure où le fait qu’une différence de 400 points se traduit par une chance de victoire dix fois plus élevé, ce qui fait consensus parmi la communauté et s’exprime bien avec les incréments par centaine habituellement utilisés pour désigner leur classement.

La principale force du classement Elo est sa capacité à s’autoréguler. La formule pour calculer l’évolution du classement est :

ELO 3

Où K(S_a-E_A) est la variation du classement R_a suite à un affrontement. Le K est une valeur arbitraire sur le déplacement maximale que pourrait avoir le rang Elo, S est une variable dichotomique, qui prend la valeur 0 ou 1 selon si le match est une victoire ou une défaite pour le joueur A. La pertinence du modèle repose dans l’incidence de la probabilité de victoire sur la variation du rang. Il serait donc impossible pour un joueur de constamment vaincre des débutants pour artificiellement gonfler son rang. Un joueur qui gagne tous ses matchs contre des joueurs débutants pourrait, par exemple, se retrouver avec un rang similaire à quelqu’un qui gagnerait et perdrait la moitié de ses matchs contre des gens de rang similaire au sien. Ceci crée un certain « équilibre » dans les incitatifs d’affrontement, c’est à dire qu’il n’existerait pas une stratégie strictement dominante pour maximiser sa progression au classement et les bons joueurs peuvent quand même retirer un avantage à jouer contre des joueurs plus faibles.

Le modèle possède, malgré tout, certaines limites. Il n’y a pas de consensus définie sur la valeur que doit prendre le rang Elo lorsque le joueur est un parfait débutant. Un rang trop bas pourrait désinciter les gens à vouloir l’affronter, alors qu’un rang trop haut fait de lui une proie facile pour un joueur de talent. Le modèle nécessite donc une période d’adaptation qui peut s’avérer parfois longue pour trouver la valeur exacte du rang d’un joueur. En second lieu, le rang Elo est avant tout un indice relatif, c’est à dire que le rang existe principalement par comparaison à d’autres. De ce fait, la comparaison entre la valeur d’un rang Elo spécifique à un moment donné et plus tard est très difficile à faire. Le phénomène devient particulièrement flagrant dans la situation où il y progression sur le niveau de jeu du joueur moyen et où il existerait un plateau où la plupart des joueurs expérimentés finissent par se retrouver. Dans cette situation, la variance de la distribution aurait tendance à diminuer et les écarts de talent entre deux joueurs ayant des Elo similaires diminueraient eux aussi, réduisant alors la précision des prédictions et la représentativité du classement pour un joueur moyen pouvant jouer une quantité limitée de parties.

Le rang Elo est probablement le classement le plus utilisé aujourd’hui dans la plupart des loisirs compétitifs comme le sport, les jeux-vidéos en ligne et même la séduction. Il semblerait que l’algorithme de l’application de rencontre Tinder utilise un indice de « désirabilité » inspiré du rang Elo pour s’assurer que les personnes qui seront suggérées par l’application soient de désirabilité similaire. En utilisant des indicateurs comme le temps passés à regarder les photos du profil, la fréquences des rejets ou des approbations, l’application part du principe que les gens plaisent aux autres dans un « intervalle » de désirabilité proche du leur et que de présenter des prétendants dans leur « ligue » aux utilisateurs augmente les chances que les deux connectent.  Ainsi donc,  sachez qu’il n’est pas si loin le jour où les magazines de conseils de séduction que l’on retrouve toujours proche des caisses dans les épiceries seront remplacés  par le manuel d’économétrie de Stock et Watson.

Sources :  

[SPIRIT OF THE LAW]. (20 décembre 2017). How Elo rating are calculated. Source en ligne : https://www.youtube.com/watch?v=GTaAWtuLHuo

CARR, Austin. « I found out my secret internal Tinder rating and now i wish i hadn’t »,  Fast Compagny ,11 Janvier 2016, source en ligne : https://www.fastcompany.com/3054871/whats-your-tinder-score-inside-the-apps-internal-ranking-system

Laisser un commentaire

Entrer les renseignements ci-dessous ou cliquer sur une icône pour ouvrir une session :

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l’aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s