Fondée au printemps 2017 reciTAL fait partie des premières équipes internationales à maîtriser et exploiter les grands modèles de langue pré-entraînés.
Le nom « reciTAL » est une référence directe au TAL, le Traitement Automatique du Langage.
Dès 2017, nous avons utilisé les modèles de langue à base de Transformers pour proposer des outils de traitement des documents. Grâce à leur pré-entrainement sur de larges volumes de données, ces modèles disposent d’une faculté de compréhension du langage qui facilitent les tâches de traitement des documents. En plus de « voir » le document, la machine peut également le lire et comprendre le sens des mots et des phrases. Ces technologies permettent de réduire drastiquement le volume de données nécessaires à l’apprentissage de la tâche souhaitée.
Qu’ils soient extractifs ou génératifs, ces modèles ont fait entrer l’IDP (Intelligent Document Processing) dans une nouvelle ère.
reciTAL propose aujourd’hui une solution LAD / RAD complète permettant d’exploiter la puissance des grands modèles de langues, On Premises ou en SaaS.
Vision industrielle
UNE NOUVELLE ÈRE
Les IA multimodales de dernière génération (texte + layout, intégrant des modèles de langue pré-entaînés) sont des technologies récentes mais matures, qui permettent d’étendre le champ de la LAD-RAD, notamment en ouvrant la voie au traitement de documents sophistiqués (documents non structurés, longs, tableaux, documents financiers, etc.).
UN NOUVEAU SAVOIR-FAIRE
Dans cette nouvelle ère, la réussite industrielle repose autant sur un savoir-faire IA (entraîner, héberger, déployer en production) que logiciel (proposer une application qui répond à la diversité et à l'exigence des processus métier).
Avantages des LLMs (Large Language Models)
LA COMPRÉHENSION
Les LLMs permettent simultanément d'extraire et de normaliser l'information. Par exemple, il est possible d'identifier les lignes d'un bilan comptable tout en les rapprochant d'un référentiel métier (plan comptable général).
LA GÉNÉRALISATION
Les LLMs "généralisent", c'est-à-dire qu'ils sont capables de traiter avec d'excellentes performances des documents dont la mise en page ou le contenu n'ont jamais été vus. Ils sont de plus peu gourmands en données puisque les plus grands modèles de reciTAL sont finetunés avec moins de 1000 exemples annotés.
LA VERSATILITÉ
Il est possible d'extraire tous types de données, sans avoir à le spécifier. L'extraction de valeurs, de paragraphes ou de tableaux est ainsi possible avec la même technologie.
L’équipe
L'équipe reciTAL a été constituée autour de deux principes : l'excellence et la diversité.
reciTAL dispose d'une équipe internationale (+10 langues parlées) de très haut niveau (5 docteurs et ingénieurs de grandes écoles).
Pour rester au meilleur niveau et suivre l'évolution très rapide du domaine, chaque membre de l'équipe technique reciTAL dispose d'une journée par semaine pour travailler sur un projet personnel technologique innovant.
Fondateurs
Gilles Moyse, PhD
CEO
Gilles est ingénieur de l’UTC et titulaire d’un doctorat en informatique de Sorbonne Université.
Frédéric Allary
Directeur général
Frédéric est diplômé de Sciences-Po, HEC et titulaire d’une licence en économétrie.
Merci aux partenaires qui contribuent à la réussite de reciTAL