LAD/RAD, OCR puis document AI : les technologies liées à la numérisation se développent et leurs applications se perfectionnent, pour s’adapter aux besoins des entreprises en matière de gestion électronique des documents (GED). L’objectif : optimiser la reconnaissance et la lecture automatique des documents, afin d’en automatiser le traitement. En ce sens, éditeurs de logiciels et intégrateurs de GED cherchent sans cesse à améliorer leur brique de capture documentaire, afin de proposer des solutions toujours plus performantes à leurs clients finaux. Pour y parvenir, différentes générations de technologies existent : LAD/RAD, OCR, document AI, Intelligent Document Processing… Qu’est-ce qui les distingue ? Laquelle vaut-il mieux choisir ? Réponses.

LAD/RAD : Lecture et Reconnaissance Automatique de Document

LAD pour lecture automatique de document, RAD pour reconnaissance automatique de document : la plupart du temps, ces 2 technologies sont associées et fonctionnent ensemble. L’essor des solutions LAD/RAD est étroitement lié à celui de la dématérialisation. L’entreprise reçoit des documents papier – factures, fax, courriers… – qu’elle doit numériser, en vue d’en traiter rapidement les informations clés, pour enrichir son système d’informations. Le support papier entrant est numérisé, et le logiciel RAD/LAD lit et récupère les informations. Ces dernières peuvent alors être intégrées au système de GED ou utilisées pour automatiser le traitement du document.

Par définition, la LAD/RAD regroupe les technologies nécessaires à catégoriser les documents et à capturer des informations textuelles en provenance de documents numérisés structurés ou semi-structurés.

Le logiciel utilise la RAD pour reconnaître automatiquement le document et le catégoriser : la technologie compare le document scanné avec les modèles de sa base de données, pour le classer en tant que devis, pièce d’identité, bon de commande… Les critères de classement sont variés, cela peut être le logo d’un fournisseur ou la mention HT, par exemple.
La technologie LAD permet ensuite de repérer les informations clés à extraire : les données du document papier numérisé sont alors capturées, pour être facilement identifiables et exploitables au format numérique.

Du document lisible au document compris : les différentes générations de LAD / RAD

OCR, LAD / RAD, Smart OCR, Smart Capture, Document AI… En matière de capture documentaire, il existe de nombreux termes, si bien qu’il est parfois difficile d’y voir clair parmi les différentes solutions.

Coupons court à tout suspense : l’un dans l’autre, les termes de LAD / RAD, OCR, Smart OCR et Document AI désignent la même chose. Ces différents process désignent tous le fait de pouvoir lire un document afin d’en automatiser le traitement. Simplement, la technologie moteur pour y parvenir diffère d’une génération à l’autre, ce qui impacte grandement la performance de la solution.

Par analogie, tous les aspirateurs ont la même fonction : aspirer la poussière. Mais entre le premier aspirateur qui fonctionnait à l’aide de soufflets manuels et le dernier Dyson, il y a un fossé. Et bien c’est exactement la même chose entre les différentes générations de LAD / RAD. Selon qu’elles utilisent un système par règle, du Machine Learning standard ou du Deep Learning, les résultats changent du tout au tout !

La LAD première génération : les prémices de la lecture de documents

La LAD historique repose uniquement sur l’OCR, la reconnaissance optique de caractères, qui permet de transformer une image en texte.

La LAD / RAD deuxième génération : un enchevêtrement de règles

Sous-catégorie du Machine Learning, le Deep Learning repose sur des algorithmes de neurones profonds, aux performances prodigieuses. Lorsque la LAD / RAD utilise le Deep Learning, il n’est plus nécessaire de paramétrer quoi que ce soit, c’est la machine qui va d’elle-même se faire une opinion, sans qu’on ait à lui expliquer et à conceptualiser ce qui fait la différence entre tel type de document et tel autre. Plus besoin de règles, la machine a juste besoin d’exemples !

Pour mieux comprendre, imaginons que l’on demande à la machine de reconnaître un chat d’un chien, d’une image à l’autre. Si un enfant de 6 mois est capable d’effectuer cette tâche, c’est quasiment impossible pour un système qui fonctionne à base de règles. Chats comme chiens ont 4 pattes et une queue, ils peuvent être petits, à poils longs ou ras, avec des oreilles plus ou moins grandes… Leur identification repose sur une combinaison de différences, immédiatement perceptibles pour un enfant, comme pour un modèle de Deep Learning. Dans ce cas de figure, il suffit d’entraîner le modèle de Deep sur une série d’images de chats et de chiens, pour qu’il soit ensuite capable de les reconnaître sur de nouvelles images qu’il n’aura jamais vues.

En outre, avec la LAD / RAD nouvelle génération, il est désormais possible de faire la LAD et la RAD en même temps, pour aboutir à un traitement automatique du document complet. En effet, un modèle de Deep Learning pré-entrainé sur plusieurs documents va à la fois le reconnaître et extraire ce qu’il doit extraire. Ce qui constitue un avantage majeur dans la simplification des workflows et la performance de la solution.

Lorsque la LAD / RAD utilise des modèles de Deep Learning, on parle de Smart Capture, de Document AI ou encore d’Intelligent Document Processing.

Premier acteur LAD/RAD labellisé Deep Tech, reciTAL édite un logiciel de traitement automatique des documents et mails, enrichi des dernières technologies d’IA. Solution d’Intelligence Document Processing par excellence, reciTAL accélère et fiabilise la catégorisation des documents et la capture des informations, pour contribuer à augmenter la performance de vos solutions. Vous souhaitez en savoir plus ? Demandez une démo !