Projet universitaire
Valorisation par IA des joueurs de NBA
Projet de Data Science visant à modéliser les mécanismes de rémunération en NBA. L'objectif était de développer un algorithme de Machine Learning capable de prédire la "juste valeur" financière d'un joueur en fonction de ses statistiques sportives et de critères contextuels, afin d'identifier les anomalies du marché.
Année :
2025
Secteur :
Data science
Client :
IDMC
Durée du projet
1 mois



Consigne :
La NBA est un marché ultra-compétitif où les salaires atteignent des sommets. La mission était de répondre à une problématique économique de notre choix par la donnée : quels sont les véritables déterminants du salaire d'un joueur ? Nous devions déterminer si la rémunération est le reflet fidèle de la performance sportive pure ou si elle dépend davantage de facteurs contextuels (prestige de l'équipe, âge, poste).



Solution :
Nous avons exploité un jeu de données de 465 joueurs (saison 2022-2023) comprenant 52 critères. Pour la modélisation, nous avons choisi l'algorithme CatBoost Regressor (Gradient Boosting). Ce choix s'est imposé pour sa capacité native à gérer les variables catégorielles (équipe, poste) et sa robustesse sur des jeux de données de taille restreinte, évitant ainsi le sur-apprentissage fréquent avec les réseaux de neurones sur ce type de volume.
Défi :
Le défi technique majeur résidait dans la distribution des données. La structure salariale de la NBA est fortement asymétrique (quelques superstars gagnent des montants extrêmes par rapport à la majorité). Cela risquait de biaiser fortement les prédictions. Nous avons résolu ce problème en appliquant une transformation logarithmique aux salaires cibles pour normaliser la distribution et stabiliser la variance avant l'entraînement du modèle.
Résultats :
Notre modèle a atteint un score de précision (R²) de 0.68, expliquant près de 70% de la variance des salaires. L'analyse a révélé que l'âge (expérience), le temps de jeu et bien sûr la popularité sont les facteurs les plus influents, primant sur l'efficacité pure au tir ou le poste. Le système a permis de générer une liste concrète de joueurs "sur-cotés" et "sous-cotés" par rapport à leur production réelle sur le terrain.
PLUS DE Projets
Projet universitaire
Valorisation par IA des joueurs de NBA
Projet de Data Science visant à modéliser les mécanismes de rémunération en NBA. L'objectif était de développer un algorithme de Machine Learning capable de prédire la "juste valeur" financière d'un joueur en fonction de ses statistiques sportives et de critères contextuels, afin d'identifier les anomalies du marché.
Année :
2025
Secteur :
Data science
Client :
IDMC
Durée du projet
1 mois



Consigne :
La NBA est un marché ultra-compétitif où les salaires atteignent des sommets. La mission était de répondre à une problématique économique de notre choix par la donnée : quels sont les véritables déterminants du salaire d'un joueur ? Nous devions déterminer si la rémunération est le reflet fidèle de la performance sportive pure ou si elle dépend davantage de facteurs contextuels (prestige de l'équipe, âge, poste).



Solution :
Nous avons exploité un jeu de données de 465 joueurs (saison 2022-2023) comprenant 52 critères. Pour la modélisation, nous avons choisi l'algorithme CatBoost Regressor (Gradient Boosting). Ce choix s'est imposé pour sa capacité native à gérer les variables catégorielles (équipe, poste) et sa robustesse sur des jeux de données de taille restreinte, évitant ainsi le sur-apprentissage fréquent avec les réseaux de neurones sur ce type de volume.
Défi :
Le défi technique majeur résidait dans la distribution des données. La structure salariale de la NBA est fortement asymétrique (quelques superstars gagnent des montants extrêmes par rapport à la majorité). Cela risquait de biaiser fortement les prédictions. Nous avons résolu ce problème en appliquant une transformation logarithmique aux salaires cibles pour normaliser la distribution et stabiliser la variance avant l'entraînement du modèle.
Résultats :
Notre modèle a atteint un score de précision (R²) de 0.68, expliquant près de 70% de la variance des salaires. L'analyse a révélé que l'âge (expérience), le temps de jeu et bien sûr la popularité sont les facteurs les plus influents, primant sur l'efficacité pure au tir ou le poste. Le système a permis de générer une liste concrète de joueurs "sur-cotés" et "sous-cotés" par rapport à leur production réelle sur le terrain.
PLUS DE Projets
Projet universitaire
Valorisation par IA des joueurs de NBA
Projet de Data Science visant à modéliser les mécanismes de rémunération en NBA. L'objectif était de développer un algorithme de Machine Learning capable de prédire la "juste valeur" financière d'un joueur en fonction de ses statistiques sportives et de critères contextuels, afin d'identifier les anomalies du marché.
Année :
2025
Secteur :
Data science
Client :
IDMC
Durée du projet
1 mois



Consigne :
La NBA est un marché ultra-compétitif où les salaires atteignent des sommets. La mission était de répondre à une problématique économique de notre choix par la donnée : quels sont les véritables déterminants du salaire d'un joueur ? Nous devions déterminer si la rémunération est le reflet fidèle de la performance sportive pure ou si elle dépend davantage de facteurs contextuels (prestige de l'équipe, âge, poste).



Solution :
Nous avons exploité un jeu de données de 465 joueurs (saison 2022-2023) comprenant 52 critères. Pour la modélisation, nous avons choisi l'algorithme CatBoost Regressor (Gradient Boosting). Ce choix s'est imposé pour sa capacité native à gérer les variables catégorielles (équipe, poste) et sa robustesse sur des jeux de données de taille restreinte, évitant ainsi le sur-apprentissage fréquent avec les réseaux de neurones sur ce type de volume.
Défi :
Le défi technique majeur résidait dans la distribution des données. La structure salariale de la NBA est fortement asymétrique (quelques superstars gagnent des montants extrêmes par rapport à la majorité). Cela risquait de biaiser fortement les prédictions. Nous avons résolu ce problème en appliquant une transformation logarithmique aux salaires cibles pour normaliser la distribution et stabiliser la variance avant l'entraînement du modèle.
Résultats :
Notre modèle a atteint un score de précision (R²) de 0.68, expliquant près de 70% de la variance des salaires. L'analyse a révélé que l'âge (expérience), le temps de jeu et bien sûr la popularité sont les facteurs les plus influents, primant sur l'efficacité pure au tir ou le poste. Le système a permis de générer une liste concrète de joueurs "sur-cotés" et "sous-cotés" par rapport à leur production réelle sur le terrain.





