Son modèle statistique de prédiction des résultats du plus grand tournoi de football mondial semblait impressionnant. La banque d’investissement Goldman Sachs avait récolté de nombreuses données sur les équipes et sur les performances individuelles des joueurs. Un modèle élaboré grâce à l’utilisation de l’intelligence artificielle dans la prédiction des facteurs qui pourraient influencer l’issue des matchs et à la simulation d’un million de combinaisons possibles.

Malgré tous ces efforts, la banque n’a pas réussi à prédire les résultats finaux des matchs de la Coupe du monde 2018, et encore moins celui de la grande finale France-Croatie.

«Bien sûr, les données passées ne permettent pas toujours de prédire le futur; Goldman Sachs n’a jamais conseillé à ses clients de prendre des décisions uniquement sur les bases de ce modèle, tempère Tom Pair, fondateur de The Upper Left Capital Partners, un hedge funds américain. La morale de cette histoire est probablement que cette technologie en proie au buzz, telle que le big data et l'intelligence artificielle, ne permet pas forcément d’effectuer des prévisions plus précises.»

Une construction statistique peu pertinente

Durant la Coupe du monde 2014 au Brésil, Goldman Sachs avait déjà mis en place un programme de ce type. Moins complet que celui de 2018, il se basait uniquement sur certains types de statistiques tels que le nombre but marqué durant les dix dernières rencontres officielles, le classement Fifa des équipes. Ce modèle était encore à perfectionner: lors de la rencontre Brésil-Allemagne, soldée par une victoire allemande de 7 à 1, le simulateur avait prédit que le Brésil gagnerait 2 à 1.

La version 2018 a rassemblé des données sur les équipes et les joueurs, puis a élaboré des simulations pour calculer quel serait le score le plus probable pour chaque match. Les premiers résultats portant sur les caractéristiques de chaque joueur, telles que son classement dans l’équipe, sa prestation défensive, ses qualités offensives, semblaient plutôt encourageants. Tout cet amas de technologie aurait dû permettre à ce modèle d’être plus performant par rapport à celui de 2014.

Pourtant, les résultats ont été rattrapés par la réalité. La célèbre banque d’investissement avait prédit que le Brésil, l’Allemagne, le Portugal et la France passeraient en demi-finale, or seule la France a réalisé cette performance.

Durant le tournoi, une version mise à jour de ces prédictions a été réalisée. Les pronostics donnaient l’Angleterre et la Belgique en finale. Malheureusement pour ces deux équipes, elles ne se sont rencontrées que pour la petite finale, déterminant la troisième place.

Peut-on tout miser sur la technologie?

Bien entendu, ces pronostics ne constituent pas des paris aux millions de dollars. «Ces prédictions restent très incertaines, même avec les techniques statistiques les plus sophistiquées, car le football est un jeu imprévisible», écrivent Manav Chaydhary et Nicholas Fawcett, analystes chez Goldman Sachs et en charge de ce rapport. «C’est précisément la raison pour laquelle la Coupe du monde est si exaltante à regarder.»

Les technologies modernes nous permettent aujourd’hui de créer des modèles statistiques d’une précision extraordinaire grâce notamment à l’intelligence artificielle et au big data. Mais la réalité est infiniment plus complexe que la construction statistique la plus avancée.

Le football est un sport qui, finalement, ne rassemble que vingt-deux joueurs sur un terrain. C’est le mélange de tous ces facteurs aléatoires –blessures, conflits, arbitrage, météo, décisions des entraîneurs, inspiration des joueurs– qui fait la beauté et le caractère imprévisible de ce sport.

Les avancées technologiques des modèles d’aujourd’hui ne doivent pas formater notre jugement. La réalité remettra toujours en cause les efforts de ceux qui essaieront de la mettre dans une case.