Un acteur de pointe
dans le NLP
dans le NLP
Comptant 6 PhD et une dizaine de publications scientifiques dans le domaine du Natural Language Processing (NLP), les équipes de reciTAL contribuent à faire évoluer l’état de l’art.
reciTAL et son laboratoire de recherche contribuent activement aux nouvelles avancées mondiales dans le domaine du NLP et réalisent régulièrement des publications dans les conférences les plus prestigieuses telles que EMNLP, ACL ou ICML.
Les travaux scientifiques de reciTAL portent plus particulièrement sur :
Document Layout Understanding : utilisation de modèles au croisement du langage et de la vision pour détecter automatiquement la structure interne des documents et faciliter leur analyse et leur exploitation.
Active learning et small data : apprentissage interactif visant à réduire le nombre d’exemples nécessaires pour améliorer la performance des modèles.
Question Answering et Question Generation : ensemble d’approches permettant de passer de requêtes en « mots clé » à des requêtes en langage naturel.
PARTENARIATS R&D
- 1 Conseil scientifique : Stuart Russell, Antoine Bordes.
- 1 Chaire académique : Chaire d’Intelligence Artificielle commune reciTAL – ESILV (Ecole Supérieure d’Ingénieur Léonard de Vinci.
- 3 Thèses CIFRE : avec le LIP6 (Paris VI Sorbonne Université et CNRS) et l’ESILV dans le domaine de la génération de texte, du Document Layout Understanding et le Question Answering.
- 1 Supercalculateur : partenariat GENCI pour l’accès au Supercalculateur Jean Zay installé et exploité au sein de l’Institut du Développement et des Ressources en Informatique Scientifique du CNRS (IDRIS) à Orsay.
CONSEIL SCIENTIFIQUE

« reciTAL is one of a small number of companies that is developing the next generation of natural langage technology »

« Le positionnement actuel de reciTAL sur le marché correspond exactement aux sujets sur lesquels l’IA peut aider aujourd’hui et avoir un impact sur les entreprises »
Scientific publications
- GAN
- NeurIPS
ColdGANs: Taming Language GANs with Cautious Sampling Strategies
- EMNLP
- MULTILINGUAL
- SUMMARISATION
- FRANCOPHONIA
- LREC
- QUESTION ANSWERING
Project PIAF: Building a Native French Question-Answering Dataset
- NER
Complex Named Entities Extraction on the Web: Application to Social Events
- ICML
- NATURAL LANGUAGE GENERATION
Discriminative Adversarial Search for Abstractive Summarization
- ARXIV
- TRANSFER LEARNING
BERT Can See Out of the Box: On the Cross-modal Transferability of Text Representations
- EMNLP
- EVALUATION
- NATURAL LANGUAGE GENERATION
Answers Unite! Unsupervised Metrics for Reinforced Summarization Models
- IEEE
- SENTIMENT ANALYSIS
- Transactions on Affective Computing
DepecheMood++: a Bilingual Emotion Lexicon Built Through Simple Yet Powerful Techniques
- ACL
- EVALUATION
- NATURAL LANGUAGE GENERATION
- QUESTION ANSWERING
Self-Attention Architectures for Answer-Agnostic Neural Question Generation