Grâce aux agents d’extraction de bilans comptables disponibles sur la plateforme reciTAL, ce grand site d’information extrait toutes les informations des bilans comptables des entreprises françaises, avec des contrôles intégrés sur plus de 700 champs dans l’actif, le passif, le compte de résultat, les immobilisations, les amortissements, les provisions, les créances et les dettes.

Un grand site d’infomations légales automatise la lecture des bilans comptables de toutes les entreprises françaises
Qui est le client ?
Le client doit être en mesure de présenter des données les plus à jour possibles aux visiteurs de son site. Par ailleurs, ces données, bien que publiques, peuvent avoir des impacts importants dans la prise de décision des entreprises qui les consultent, et doivent donc être vérifiées et validées avec certitude.
Le contexte du projet
Le client a besoin d’une solution performante, fiable et robuste, capable d’extraire avec précision les valeurs issues de l’ensemble des bilans comptables publiés en France. L’enjeu principal résidait dans le haut niveau de qualité des données extraites, afin de limiter au maximum les interventions de vérification et de correction manuelles, et ainsi réduire les coûts associés.
Les challenges
Les bilans comptables peuvent se présenter sous différents formats : CERFA ou libre, et dans les versions complètes (2050) ou simplifiées (2033). Selon les entreprises, ces formats varient considérablement : certains bilans libres intègrent des lignes détaillées absentes du CERFA. De plus, certains documents sont peu lisibles ou présentent des numérisations déformées. Enfin, les bilans peuvent être particulièrement volumineux, comportant un très grand nombre de pages à traiter.
Le volume de bilans à traiter atteint des niveaux particulièrement élevés lors des périodes de pic, pouvant dépasser les 15 000 documents en une seule journée.
La solution
Sur sa plateforme SaaS sécurisée, reciTAL a développé et entraîné des modèles capables de classifier les bilans et d’en extraire automatiquement les valeurs, indépendamment du format (CERFA ou libre) et de la structuration des tableaux. Un modèle général couvre l’ensemble des pages métier (actif, passif, compte de résultat, etc.), tandis qu’une suite de modèles spécialisés vient en renfort afin de corriger avec finesse les éventuelles imprécisions du modèle principal. Une pipeline sophistiquée assure la classification, l’extraction, l’itération avec des modèles experts, ainsi que des mécanismes de contrôle et de correction automatisés.
De plus, les écrans de vidéo-codage de la plateforme reciTAL sont utilisés par les équipes du BPO en charge de la prestation.
Le projet
La pipeline reciTAL a été mise en production en 6 mois, grâce à un travail conjoint entre reciTAL, le client final, et un intégrateur / BPO qui gère aujourd’hui le suivi de la production et les équipes de vidéo codage.
Planifez une démo
de 30 minutes pour voir la plateforme en live avec notre expert
Autres automation stories