🔍
Crossfit Games - Rétrospective de l'Open 2019

Crossfit Games - Rétrospective de l'Open 2019

Note: Cet article a été traduit avec Claude Code le 31 janvier 2026. La version originale est disponible ici.

Bonjour, la saison de l’Open commence à nouveau cette année (encore une fois !?) donc j’écris cet article pour :

  • Présenter un nouveau dataset sur kaggle
  • Avoir un aperçu du dernier open

Qu’est-ce que l’Open ?

L’Open est un processus de sélection pour la “coupe du monde” appelée les Games de crossfit qui se déroulera l’année prochaine aux États-Unis. Cette sélection dure 5 semaines, composée de 5 événements appelés WoD où chaque participant à l’open doit compléter pour obtenir un score et être dans le classement pour la sélection pour les Games (où les meilleurs du classement sont choisis). Tout le monde faisant partie d’une salle de sport appelée affiliate peut participer à cette compétition, il y a plusieurs divisions et si vous ne vous sentez pas capable de faire le WoD original (comme moi), vous pouvez faire une version “scaled” où l’original sera un peu modifié mais l’esprit de l’exercice sera le même.

Vous pouvez trouver plus de détails sur les exercices du dernier open à ce lien.

J’ai commencé à collecter les données sur l’Open en 2018 dans un précédent article, j’ai maintenant décidé de partager une partie des données que j’ai collectées sur les événements. Les données peuvent être trouvées à ce lien sur le site web kaggle et vous trouverez des données sur l’open de 2019.

Le dataset est décrit et j’essaierai d’ajouter de plus en plus de données sur les opens et les games dans le futur (je prévois de faire du travail ML avec ces données dans le futur).

Donc maintenant commençons l’analyse.

Aperçu de l’Open

Dans la figure suivante, il y a une répartition des athlètes dans les différentes divisions de la sélection.

Plot 1 illustration

Comme nous pouvons le voir, les divisions les plus populaires sont les divisions Hommes et Femmes et la plupart des athlètes ne font pas de scaled de l’exercice. Il y a environ 355418 athlètes qui étaient dans la compétition.

Pour la prochaine étape de l’analyse, je vais me concentrer sur les divisions Hommes et Femmes, non scaled (donc environ 341875 athlètes).

Voyons maintenant la popularité de la compétition dans ces divisions.

Plot 2 illustration

Comme le crossfit vient des États-Unis, comme prévu le bastion d’athlètes le plus important est aux États-Unis suivi par le Brésil et le Royaume-Uni. Les autres groupes de pays sont beaucoup plus petits que les États-Unis.

Quelle est la parité dans ces groupes ?

Plot 3 illustration

Il semble qu’il y ait encore plus d’hommes mais la parité n’est pas trop éloignée.

J’ai calculé des analyses simples sur les athlètes basées sur le score global pendant l’open et j’ai classé en différentes catégories :

  • Sont-ils des athlètes top 100 ? Oui ou Non
  • Sont-ils des athlètes top 1000 ? Oui ou Non

Donc voyons si certains pays peuvent être définis comme “nid de champions”.

Évaluation des pays basée sur leurs meilleurs athlètes

Jetons d’abord un œil sur les pays où le crossfit est le plus populaire.

Plot 4 illustration

Comme nous pouvons le voir, la popularité n’est pas synonyme de champion. Si nous exceptons les États-Unis, l’ordre n’est pas respecté sur le nombre de meilleurs athlètes.

Plot 5 illustration

Toujours la même logique mais chaque pays a des champions dans le top 1000.

Jetons maintenant un œil sur les meilleurs pays basés sur le nombre de meilleurs athlètes.

Plot 6 illustration

Comme nous pouvons le voir, il y a de nouveaux venus dans la liste des pays, et certains petits pays comme la Nouvelle-Zélande et l’Islande (en termes de crossfiters et de population) font des champions (l’ancienne femme qui a gagné les games cette année vient de Nouvelle-Zélande).

Maintenant essayons de trouver la réponse à la question suivante :

Qu’est-ce qui fait un athlète de haut niveau ?

J’ai essayé d’ajouter des données liées au pays provenant des données de la Banque mondiale mais je n’ai trouvé aucune connexion réelle entre le pays et le fait d’avoir des athlètes de haut niveau dans leur pool (j’ai attaché certaines de ces données dans le dataset Kaggle).

Comme dans les données sur les athlètes, certains d’entre eux ont donné leur poids et leur taille (mais c’est un champ libre donc il y a beaucoup de déchets à l’intérieur). Si je supprime simplement les athlètes qui n’ont pas rempli le champ, je perds environ 45% des athlètes. J’ai juste fait un rapide pairplot avec la taille, le poids et le BMI versus si l’athlète est dans le top (j’ai supprimé certaines mauvaises valeurs).

Plot 7 illustration

Il n’y a pas de corps optimal réel, il semble que pour être dans les meilleurs athlètes, les gens ont l’air très en forme mais ils n’ont pas de corps fous (comme Hercule ou Captain America), ce sont des personnes avec une taille normale mais très en forme.

Mais maintenant une nouvelle question surgit dans mon esprit : Gèrent-ils leur effort pendant l’Open ?

Jusqu’à présent, les WoD ne sont pas connus à l’avance donc peut-être que ces gars essaient de garder de l’énergie pendant tout l’Open pour être plus performants sur certains WoD spécifiques. Il y a un pairplot basé sur le score des athlètes à chaque WoD.

Plot 8 illustration

Les résultats sont les mêmes pour les femmes que pour les hommes mais comme nous pouvons le voir pour les Hommes, il y a définitivement des clusters basés sur le fait que la plupart des athlètes ne complètent pas tous les WoD. Zoomons sur les athlètes qui ont vraiment complété tous les WoD.

Plot 9 illustration

Il semble qu’il n’y ait pas de “laisser aller” pour les athlètes du top 100, ils vont “ALL IN” et ils sont toujours sur le meilleur score pour chaque WoD. Le top 1000 semble un peu plus dispersé que le top 100 donc nous pouvons dire que les 100 sont définitivement des MACHINES.

Conclusion

Comme nous pouvons le voir de cette analyse :

  • le crossfit semble être un sport qui est populaire pour les hommes et les femmes, et cela pourrait être expliqué par le fait qu’il a toujours été annoncé de manière égale pour les deux genres
  • Les meilleurs athlètes n’ont pas de physique hors du commun en termes de poids et de taille
  • Il ne semble pas qu’il y ait de stratégie pour gagner l’Open, juste aller ALL IN

Comme je l’ai dit précédemment, je prévois d’ajouter plus de données dans le dataset et de faire d’autres analyses mais honnêtement cette analyse est un apéritif (comme 2 heures max), n’hésitez pas à me contacter si vous avez des remarques/idées/résultats pour le dataset.