Labcom : une IA souveraine pour indexer automatiquement des contenus numériques

21 mars 2022

Présentation de la solution Ephoto Dam ©Einden

À Poitiers, le laboratoire Xlim (Université de Poitiers/Université de Limoges/CNRS) vient de lancer un laboratoire commun avec Einden, entreprise spécialisée dans la gestion de médias pour les entreprises. Objectif : développer des fonctionnalités d’indexation automatique des contenus grâce à une IA indépendante des Gafam.

Mis à part deux tweets laconiques de l’Université de Poitiers et une page dédiée sur le site de l’entreprise Einden, également pictavienne, peu d’éléments ont filtré sur DAMIALab, l’un des 21 nouveaux laboratoires communs sélectionnés par l’Agence nationale de la recherche (ANR), en décembre 2021. Ce labcom entre Einden et Xlim, un laboratoire de recherche du CNRS sous tutelle des universités de Poitiers et de Limoges, est « le premier destiné à répondre aux problématiques soulevées par la gestion des actifs numériques », commente Philippe Carré, son coordinateur, côté Xlim.

Cette discipline, plus connue sous son nom anglais de digital asset management (DAM), regroupe la collecte, l’annotation, l’indexation et la recherche de médias hétérogènes (photos, vidéos, plans, catalogues…) dans de grandes bases de données. Autrefois très laborieux et exclusivement effectués par des humains, ces processus sont de plus en plus automatisés grâce au développement d’algorithmes d’apprentissage profond (deep learning), dont les réseaux de neurones sont les plus connus. En la matière, les champions ne sont autres que les fameux Gafam, Google et Facebook en tête.

Développer des solutions d’IA souveraines

C’est dans ce contexte qu’Einden souhaite faire évoluer sa solution Ephoto Dam, une suite logicielle de gestion des médias pour les entreprises, que la PME vend à environ 300 clients dans divers secteurs industriels: tourisme, marketing et communication, éducation, presse et édition, mais aussi à quelques acteurs publics. « À l’heure actuelle, Ephoto Dam fonctionne majoritairement par indexation textuelle, c’est-à-dire par simples mots-clés, sans un système complet d’analyse automatique de l’image », indique Philippe Carré, avant de nuancer : « L’entreprise utilise bien quelques briques d’intelligence artificielle, mais il s’agit alors de solutions sur étagère, empruntées notamment aux Gafam. Or, certains clients d’Einden sont sensibles (infrastructures critiques, armées, État…) et il peut être délicat pour eux de faire appel à ces acteurs. »

L’objectif de DAMIALab, dont l’inauguration est prévue pour l’été 2022 et le début des activités pour septembre, est de développer, en quatre ans, des fonctionnalités d’automatisation du DAM indépendantes des solutions sur étagère, « dans un souci de souveraineté numérique », souligne Philippe Carré.

une indexation par contenu qui permet aux clients d’affiner leurs requêtes en fonction de caractéristiques préétablies

Philippe Carré

Concrètement, les travaux du labcom se dérouleront en deux phases. La première année, les équipes de Xlim travailleront sur la mise en place de fonctionnalités de classification à facettes, « une indexation par contenu qui permet aux clients d’affiner leurs requêtes en fonction de caractéristiques préétablies (profondeur de champ ou couleur dominante d’une image…) », détaille Philippe Carré. Sans oublier un algorithme intelligent qui supprime les doublons en évitant les faux positifs. Les deuxième et troisième années seront consacrées à intégrer l’expertise des clients d’Einden dans les fonctions d’indexation, en utilisant des techniques d’apprentissage actif (active learning) et par renforcement (reinforcement learning) – que l’on retrouve dans les fameux algorithmes d’AlpahaGo et de DeepMind. Une telle indexation ultra-fine permettrait, par exemple, d’enrichir une recherche dans la base de données avec des suggestions ciblées pour tel utilisateur, à tel moment. « Il s’agit presque d’anticiper les besoins du client », sourit Philippe Carré.

Un financement de l’ANR de 163000 euros sur quatre ans

Pour mener à bien ces travaux, une quinzaine de personnes seront mobilisées entre les locaux d’Einden et ceux de Xlim, auxquelles s’ajouteront un doctorant, un ingénieur de recherche et plusieurs étudiants en stage, recrutés grâce aux 163 000 euros de financement de l’ANR.

Grâce à ce labcom, qui donnera aux équipes de Xlim «accès à une base de médias labellisés gigantesque, une pépite quand on travaille en intelligence artificielle», témoigne Philippe Carré, celui-ci espère la publication de deux ou trois articles scientifiques et la valorisation des travaux de son laboratoire dans une poignée de conférences. «Ces objectifs évolueront en fonction de l’ampleur que prendra DAMIALab», poursuit le chercheur.

En effet, la quatrième année du labcom servira à la fois à amortir les éventuels retards et à aider à l’industrialisation des résultats de recherche et leur intégration à la solution Ephoto Dam, mais sera surtout « un levier vers la suite », confie le chercheur. À savoir : les deux partenaires ont le double objectif de démarrer une deuxième thèse et de prolonger le labcom d’au mois plusieurs années. Pour financer ces ambitions, Philippe Carré compte aller chercher des aides du côté de la région Nouvelle-Aquitaine, notamment. «Avec DAMIALab, nous sommes à la fois sur des temps courts, car l’entreprise veut monter en compétences sur certaines fonctionnalités, et sur des temps longs, parce que ces problématiques de recherche sont complexes, conclut-il. Mais une chose est sûre : les activités de ce labcom ne s’arrêteront pas aux quatre ans initiaux.»

Xlim et Einden, une collaboration de longue date

Le laboratoire commun ANR DAMIALab n’est pas le premier projet commun du laboratoire Xlim et de l’entreprise Einden, tant s’en faut. La première collaboration entre les deux entités pictaviennes remonte à 2012 avec le lancement d’une thèse sur le traitement d’images et la détection automatique de similarités dans une grande banque d’images, dans le cadre du dispositif des Conventions industrielles de formation par la recherche (Cifre). Un «joli partenariat» qui laisse un bon souvenir à Philippe Carré, du laboratoire Xlim, puisque «Einden avait recruté le jeune docteur à l’issue de la thèse», se remémore-t-il, avant d’ajouter qu’il «y travaille encore aujourd’hui». Depuis 2020, Xlim et Einden co-organisent également un concours dans le cadre du workshop annuel AI4Industry, une sorte de hackathon ouvert à tous les étudiants de Nouvelle-Aquitaine pour répondre à des problèmes posés par l’entreprise. «En 2022, les étudiants de l’Université de Poitiers ont même gagné le concours et ont présenté leurs résultats le 10 février à Bordeaux, dans une journée baptisée Dataquitaine, sur les solutions d’IA développée pour l’industrie», se félicite enfin Philippe Carré.

Retrouvez les autres actualités thématiques de poC média

Inscription Newsletter

Vous souhaitez suivre l'actualité des technologies deeptech ?

Recevez gratuitement une newsletter par semaine

Je m'inscris
Fermer