EN BREF

  • Projet: Image Metadata Generation chez Decathlon
  • Objectif: Enrichir la médiathèque avec des métadonnées pour 20 millions d’assets
  • Types d’assets: Communication, identité de marque, présentation des produits
  • Volume d’images: Environ 2 millions de photos de produits
  • Technique: Inférence par lots avec traitement asynchrone
  • Résolution: Redimensionnement à 300 pixels avec compression JPEG qualité 85
  • Workflow: Prétraitement quotidien, traitement horaire
  • Coût: 3229 € pour traiter 2 millions d’images, générant jusqu’à 1,2 M€ d’économies annuelles
  • Performance: Taux de validation jusqu’à 93%

Decathlon a mis en place un projet innovant, Image Metadata Generation, pour enrichir les métadonnées de sa médiathèque contenant près de 20 millions d’assets. En production depuis fin 2025, ce projet se concentre principalement sur l’enrichissement des descriptions et des balises SEO des 2 millions de photos de produits. En raison des quotas mutualisés sur un unique compte AWS, Decathlon a choisi un traitement asynchrone par lots, permettant de traiter jusqu’à 25 000 images par jour, tout en réduisant les coûts liés à l’inférence. Grâce à l’optimisation des prompts et à un workflow quotidien, la société améliore non seulement la recherche et l’indexation dans les DAM mais favorise également la conformité aux directives d’accessibilité. En estimant des économies potentielles de 1,2 M€ par an, Decathlon démontre comment l’utilisation de modèles de langage avancés peut transformer le traitement des contenus multimédias.

Decathlon, l’un des leaders mondiaux dans le secteur du sport, a récemment face à un défi de taille : l’enrichissement des métadonnées de sa vaste médiathèque. Avec près de 20 millions d’assets regroupés en trois catégories principales, à savoir la communication, l’identité de marque et la présentation des produits, l’entreprise a intégré les modèles de langage avancés pour réaliser cet objectif. Dans cet article, nous allons explorer le fonctionnement de leur projet Image Metadata Generation, les méthodes utilisées pour traiter efficacement leurs images, ainsi que les bénéfices observés sur la recherche et l’accessibilité des contenus.

Les enjeux de l’industrialisation sur AWS

Avec l’objectif d’industrialiser ses processus tout en utilisant un seul compte AWS, Decathlon a dû faire face à des quotas mutualisés, notamment en ce qui concerne l’inférence. Ce défi a été particulièrement visible lors de la mise en œuvre de leur projet Image Metadata Generation, lancé fin 2025. En effet, pour gérer les 2 millions de photos de produits, il était essentiel de générer des descriptions, des balises et des mots-clés SEO afin de maximiser l’exploitation des contenus tout en respectant la directive européenne sur l’accessibilité.

Un défi technique majeur : le traitement des images

Le principal défi technique auquel Decathlon a été confronté était le traitement des images à grande échelle. Le traitement à la demande des 2 millions d’images aurait engendré une saturation de leurs ressources. Lévi Bernadine, ML engineer chez Decathlon Digital, a expliqué que le traitement séquentiel, validé avec un PoC (Proof of Concept) à petite échelle, était inapplicable dans cette configuration. L’invocation synchrone aurait représenté un véritable antipattern et aurait créé des goulets d’étranglement comme des files d’attente, des timeouts, et des rejets de requêtes.

Une solution innovante : le traitement asynchrone par lots

Pour surmonter ce défi, l’équipe a opté pour un traitement asynchrone, intégrant l’inférence par lots. Cette méthode permet non seulement de désengorger les ressources utilisées par les différentes équipes, mais aussi de diviser les coûts par deux par rapport à un traitement à la demande. En effet, chaque image en entrée consomme des tokens proportionnels à sa taille, ce qui rend crucial un traitement optimisé. Toutefois, cette approche présente des inconvénients tels que l’absence de garantie sur le délai d’exécution des jobs.

Redimensionnement et compression des images

Dans le cadre de ce processus, les images ont été redimensionnées à 300 pixels en hauteur ou en largeur, tout en conservant leur ratio. Un format JPEG de qualité 85 a été appliqué pour garantir que les fichiers résultants soient en moyenne 96 % plus légers que les images originales, une optimisation essentielle pour le traitement des réglages dans le système de gestion des actifs numériques (DAM).

Optimisation des prompts pour une meilleure cohérence

Decathlon a également expérimenté différentes options de prompts pour générer des descriptions et des mots-clés. Après avoir constaté une incohérence dans les résultats, l’équipe a choisi d’utiliser un prompt unique, ce qui présente l’avantage de ne consommer qu’une seule requête API. Ce prompt se décline en deux variantes, adaptées selon le type d’image : l’une pour les packshots et l’autre pour les photos de pratiques sportives, visant à capturer l’action, l’atmosphère et l’émotion.

Un workflow structuré pour le prétraitement

Le système de prétraitement automatique de Decathlon se déroule une fois par jour. Il est synchronisé avec la mise à jour des tables dans leurs data lakes. Les étapes de ce workflow incluent la localisation des assets dans le DAM qui n’ont pas encore passé la phase de génération ou qui nécessitent une mise à jour. Les images sont ensuite téléchargées en qualité originale via le CDN de Decathlon et préparées pour les modèles de langage tels que Claude (Anthropic) et Nova (Amazon).

Le processus de traitement horaire

Le traitement des images se fait toutes les heures, en parallèle. Le système vérifie le statut des images dans le registre et celles prêtes à être traitées sont regroupées en lots de 500 à 2000 images. Ces lots sont ensuite transmis à Bedrock grâce à un pont IAM, tandis que l’API Batch aide à pousser les résultats vers S3, où les descriptions et mots-clés en plusieurs langues sont stockés. Ce mécanisme rend le suivi des traitements efficace, avec une vérification du statut toutes les demi-heures.

Des résultats financiers impressionnants

L’implémentation de ce système serverless a permis à Decathlon de traiter jusqu’à 25 000 images par jour. En termes de performances, les données révèlent que les taux de validation des résultats ont atteint jusqu’à 93 % à travers divers évaluateurs et outils. Grâce à cette innovation, Decathlon estime générer jusqu’à 1,2 million d’euros d’économies annuelles, à comparer aux 7 millions d’euros qu’elle dépense pour la création, la correction et la traduction de ses contenus.

Exploration de nouveaux cas d’usage

En plus de ce projet, Lévi Bernadine mentionne également d’autres cas d’usage potentiels, tels que l’identification de mannequins dans leurs images. L’équipe examine également comment appliquer des A/B testing des images et descriptions, ce qui pourrait renforcer l’engagement des visiteurs sur les plateformes e-commerce de Decathlon.

Coûts associés aux modèles de langage

En ce qui concerne les coûts LLM, Decathlon a dépensé 3229 euros pour traiter les 2 millions d’images. Cette somme inclut 2125 euros pour l’entrée, représentant 2,31 milliards de tokens dont 85 % étaient liés aux pixels d’image, et 1104 euros pour le traitement en sortie. Notamment, le coût aurait grimpé à environ 18 000 euros avec d’autres modèles tels que Claude Sonnet 4.5. En optant pour des traitements à la demande en pleine résolution, les prévisions financières auraient atteint des sommes exorbitantes autour de 30 000 euros avec Nova Pro et 160 000 euros avec Claude Sonnet.

Impacts sur le SEO et l’accessibilité

Le projet Image Metadata Generation permet non seulement d’optimiser le référencement sur le web, mais il améliore également l’accessibilité des contenus. La efficacité du traitement permet de réduire la duplication d’images dans le DAM, facilitant ainsi la recherche pour les utilisateurs et améliorant l’indexation dans les moteurs de recherche. Cela renforce la conformité aux normes d’accessibilité que se fixe l’entreprise.

Pour approfondir les enjeux liés aux modèles de langage et leur impact sur le SEO, vous pouvez consulter des articles détaillés sur le sujet : Maîtriser le SEO sur YouTube, Impact des LLM sur le SEO, Optimisation pour les moteurs de recherche et géolocalisation, Leçons initiales du changement radical du SEO et Dernières tendances SEO et IA.

À travers ces initiatives, Decathlon ne se contente pas de moderniser sa médiathèque, mais elle établit aussi un nouveau standard en matière d’innovation et d’efficacité dans le secteur de la grande distribution sportive. En intégrant des modèles de langage avancés dans ses processus, l’entreprise démontre comment la technologie peut transformer la gestion des données pour offrir une meilleure expérience utilisateur et des économies substantielles.

améliorez la qualité et la pertinence de vos données grâce à l'enrichissement des métadonnées, optimisant ainsi la recherche, l'organisation et l'analyse de vos contenus numériques.

Decathlon a fait le choix stratégique d’utiliser un compte AWS unique pour l’industrialisation de ses processus, permettant ainsi une optimisation des ressources dans le cadre du projet Image Metadata Generation. Ce projet, qui est en production depuis fin 2025, joue un rôle crucial dans l’enrichissement de la médiathèque contenant près de 20 millions d’assets. Ces contenus couvrent des domaines tels que la communication, l’identité de marque et la présentation des produits.

L’initiative Image Metadata Generation a pour but de générer des descriptions, des balises, et des mots-clés SEO pour environ 2 millions de photos de produits. Cela non seulement facilite l’exploitation des contenus, mais assure également la conformité à la directive européenne sur l’accessibilité. Selon Lévi Bernadine, ML Engineer chez Decathlon Digital, la gestion des quotas mutualisés pour l’inférence a posé des défis initiaux. Traiter les images à la demande risquait de créer une saturation dans le système.

Afin de surmonter ces obstacles, Decathlon a opté pour un traitement asynchrone avec inférence par lots. Ce choix a permis de réduire les coûts de moitié par rapport à un traitement à la demande. Parallèlement, cela a également permis de prévenir les erreurs qui pouvaient faire planter l’ensemble d’un lot. Une exigence majeure est restée la maîtrise des coûts, car la consommation de tokens était proportionnelle à la taille des images en entrée.

Pour faciliter l’efficacité de ce traitement, les images ont été redimensionnées à 300 pixels tout en conservant leur ratio, et une compression JPEG qualité 85 a été appliquée. Le résultat ? Les fichiers traités s’avèrent en moyenne 96 % plus légers que les originaux, ce qui optimise à la fois le stockage et la rapidité d’accès aux contenus.

Dans le cadre du projet, Decathlon a développé un worfklow de prétraitement qui s’enclenche quotidiennement. Ce processus comprend plusieurs étapes, telles que la localisation des assets non traités, leur téléchargement, la préparation des prompts pour les modèles, et enfin le stockage des images compressées. Avec un traitement horaire exécuté en parallèle, 25 000 images sont traitées par jour, améliorant ainsi considérablement l’indexation et réduisant la duplication d’images au sein du DAM.

Ce système serverless a permis à Decathlon de réaliser des économies significatives, avec un potentiel de 1,2 M€ d’économies annuelles. Les résultats des validations se sont révélés convaincants, atteignant jusqu’à 93 % de taux de validation à travers divers évaluateurs. De plus, les équipes continuent d’explorer d’autres cas d’usage, tels que l’identification de mannequins reconnaissables et la mise en place de A/B testing des images et des descriptions pour améliorer l’expérience client.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *