La start-up Authôt veut devenir le leader du sous-titrage grâce à l’université de Toulouse
Retranscription en direct de l’allocution du 12 mars 2020
d’Emmanuel Macron via Authôt Live
La start-up a élaboré une technologie qui réduit par deux le temps et le coût de transcription des discours. Grâce à cet atout, elle s’est imposé sur le marché européen du sous-titrage. Une ambition que l’entreprise a pu concrétiser grâce à une collaboration fructueuse avec l’Institut de Recherche en informatique de Toulouse (IRIT).
Les points à retenir :
- Authôt s’est associée à la recherche publique dès sa création
- La start-up a fait évoluer son modèle économique grâce à l’embauche d’un doctorant en thèse Cifre au sein de l’IRIT
- L’entreprise réfléchit à créer un laboratoire commun avec l’IRIT
Authôt a été créée en 2012 par deux étudiants de l’ISEP, École d’ingénieurs spécialiste du numérique. À l’époque, Olivier Fraysse et Stéphane Rabant veulent proposer des retranscriptions plus fiables que celles réalisées par la prise de notes, en développant un algorithme capable de retranscrire n’importe quel discours, malgré les bruits environnants ou les particularités du locuteur. Au sortir de l’école, les deux fondateurs intègrent l’incubateur des Arts et Métiers pour mettre en œuvre leur projet de start-up.
Les deux étudiants misent très tôt sur la recherche pour se distinguer sur ce marché déjà concurrentiel. « À l’époque, de nombreux acteurs, des entreprises comme des laboratoires, étaient positionnés sur ce secteur », explique Stéphane Rabant, CTO et cofondateur de l’entreprise. Authôt se rapproche alors d’une première structure, le Laboratoire d’informatique de l’Université du Mans (LIUM). Une première collaboration est nouée avec le laboratoire pour mettre au point l’algorithme.
Repositionnement d’Authôt
Les efforts de la start-up pour développer son propre algorithme ne s’avèrent pas suffisants pour rester dans la compétition. « À l’époque, il existait plusieurs systèmes de transcription, avec des acteurs comme l’Université de Cambridge ou Google. Ces derniers étaient particulièrement bons pour analyser des sons “bruités”, par exemple », ajoute Stéphane Rabant. Consciente qu’elle n’a pas les moyens financiers pour rester dans la course, la start-up explore une autre piste de croissance : proposer aux utilisateurs de choisir pour eux l’algorithme le plus adapté pour la transcription automatique de leur contenu audio.
Un système de reconnaissance du langage est constitué de deux parties : un modèle acoustique, qui converti les sons en phonème, et le modèle de langage, qui converti ces phonèmes en texte. « Nous avons développé un système qui préanalyse les paramètres acoustiques comme le bruit, la réverbération et la superposition de parole pour évaluer le pourcentage de fiabilité d’un système donné », poursuit le CTO. Cette solution aura l’avantage de faire gagner du temps aux clients, tout en réduisant l’impact environnemental de l’appareil. « Tester plusieurs algorithmes consomme beaucoup de temps et d’énergie », rappelle simplement Stéphane Rabant.
Une première thèse Cifre avec l’IRIT
Reste à développer cet outil. Authôt est alors mis en relation via la Satt TTT avec un autre laboratoire expert dans l’analyse du langage, l’IRIT (cf. encadré). Un premier contrat est lancé. « À l’époque, aucun système ne s’occupait de la ponctuation », se souvient Jérôme Farinas, spécialiste du traitement automatique du langage à l’IRIT. Mis en confiance par le succès du projet, les deux fondateurs engagent, en 2017, un doctorant issu de l’IRIT pour travailler sur ce système d’analyse. La thèse Cifre, qui permet à un doctorant de réaliser sa thèse au sein d’une entreprise, porte sur « la prédiction a priori de la qualité de la transcription automatique de la parole par l’analyse de l’environnement sonore ». Les travaux menés par le doctorant Sébastien Ferreira se révèlent fructueux, et sont actuellement en cours d’intégration par Authôt.
L’entreprise a profité de ces performances pour diversifier son offre. Elle propose aujourd’hui des solutions de sous-titrage en direct de vidéos, et en plusieurs langues. La start-up compte ainsi près de 1000 clients et a levé un demi-million d’euros en 2019. Authôt croit désormais sur le marché européen du sous-titrage. Elle n’a toutefois pas fini d’exploiter les résultats de la thèse. « La thèse portait sur différents aspects, comme la reconnaissance d’une parole recouverte par une autre parole, ou d’une parole recouverte par de la musique. Nous voudrions aussi travailler sur l’analyse des accents régionaux, ou des dictons… », détaille Stéphane Rabant.
Une recherche subventionnée, mais coûteuse
L’embauche d’une thèse Cifre est largement subventionnée, à hauteur de 14 000 €. La part du salaire du doctorant non subventionnée est également éligible au CIR. En définitive, près de la moitié du salaire d’un doctorant peut être subventionné, ce qui a joué un grand rôle dans l’embauche d’Authôt. Une aide bienvenue, car la recherche coûte cher, et que la réussite des projets n’est jamais acquise. « Nous avions beaucoup investi dans la recherche au début d’Authôt, pour développer notre système de transcription, ce qui n’a pas forcément payé. Nous sommes heureux, cette fois, que ce soit un succès », se réjouit Stéphane Rabant. Cette expérience encourage pour l’instant Authôt à continuer sa collaboration avec la recherche. La start-up pense même à monter un laboratoire avec l’IRIT. Un projet qui devrait attendre encore quelques années.
L’IRIT, géant de la recherche en Occitanie
L’Institut de recherche en informatique de Toulouse est composé de 600 membres, répartis en cinq équipes : conception des systèmes, modélisation numérique, cognition et interaction, systèmes autonomes adaptatifs, et traitement de la donnée. Le laboratoire s’adresse ainsi à un vaste éventail de marchés.
Authôt est entrée en contact avec Jérôme Farinas, maître de conférence en traitement automatique du langage, et directeur d’une équipe de recherche spécialiste de l’indexation de documents audio et vidéo. Le chercheur est également le représentant d’un institut Carnot, l’Institut Cognition, label attribué aux laboratoires entretenant des relations développées avec le monde économique.
Contacts de Jérome Farinas – IRIT
- 05 61 55 83 43
- jerome.farinas@irit.fr