Extraction automatique des données importantes d'un document (N° et date de facture, Montant HT, TTC, ...)
Alimentation automatique d'un ERP ou d'un système comptable. ZeDOC Spot est un outil d'analyse d'images (factures numérisées par exemple) qui permet de retrouver automatiquement les informations intéressantes.
Il est doté d'un système d'intelligence artificielle lui permettant d'apprendre seul, d'être autonome face à la nouveauté sans intervention humaine.
A titre d'exemple, pour le traitement de factures, ZeDOC Spot extrait, dès le premier jour, 100% des 6 champs d'entête et pieds de page sur 66% des documents traités !
Types de données traitées
ZeDOC Spot accepte en entrée des fichiers en provenance de plusieurs sources :
• Images (TIF, JPG).
Les images sont produites via l'utilisation d'un scanner de production.
Les fichiers pourront aussi être récupérés depuis un copieur numérique en réseau.
La résolution minimale est de 300 DPI.
La compression des fichiers sera CCIT groupe 3 ou 4.
• Bureautique (DOC, XLS, PPT, PDF).
Les fichiers bureautiques pourront être récupérés depuis un dossier particulier.
Architecture Spot
ZeDOC Spot est composé de plusieurs modules.
Les modules serveurs communiquent entre eux via une base de donnée MySQL.
Le premier module serveur (Demon Web Service) gère la récupération des fichiers TIF et bureautiques. Les fichiers récupérés, sont alors mis à la disposition du serveur d'OCR.
La phase d'OCR est cruciale pour la récupération ultérieure des informations. Un système de filtres destinés à nettoyer les images est intégré à ce serveur d'OCR.
Le serveur d'OCR exporte le fichier source, un fichier PDF Texte(OCR)/image et un document XML dans un répertoire pour être « vidéo codé » si nécessaire (mauvaise reconnaissance, saisie d’une information manquante sur le document, …).
Lorsqu'un document est validé, il est pris en charge par un module d'export. Ce module génére un fichier ZML optionnel (XML) contenant lui les métas-données afin de pouvoir les archiver directement dans une base de connaissance ZeDOC Net Solution. La génération du fichier ZML permet aussi d'alimenter un ERP, un workflow, un système comptable, ...
Le nombre de champs n'est pas limité et les documents peuvent être traités selon des modèles possédant chacun des champs particuliers. On pourra donc définir un modèle de traitement spécifique pour les factures et les avoirs ou tout autre document semi-structuré.
Présentation de l'interface de vidéo codage pour le traitement d’une facture

1- Affichage du document quelque soit la source de l’image (TIF ou PDF).
2- Affichage de la structure du document, du numéro de page actuellement en visualisation.
3- Information de saisie de l’émetteur en vue de la phase d’apprentissage.
4- Les différentes informations à vidéo-coder (avec les différents codes couleurs).
5- Bouton de validation pour valider le document courant et passer au document suivant.
6- Effet de surlignage sur la zone ou la donnée a été extraite par le moteur de LAD.
Il est possible d'effectuer des vérification de champs via la mise en place de liens ODBC.
Une de nos réalisations pour un cabinet comptable :
Pour cette application, SPOT est interfacé avec la comptabilité Quadratus (©).

Afficher l'image en taille réelle
Sur cette copie d'écran, on voit que le document scanné (sur la partie droite) est correctement analysé par SPOT; toutes les données choisies lors de la phase de paramétrage ont bien été trouvées:
-
les données du dossier sont récupérées dans la base comptable
-
le fournisseur est identifié par les informations de la facture puis recherché dans la base comptable. S'il existe, son N° de compte est utilisé, sinon un nouveau compte est proposé (et créé).
-
les informations de l'entête sont extraites de la facture
-
les totaux sont extraits de la facture (un contrôle de cohérence assure que les données importées sont équilibrées).
-
le dernier compte de charge utilisé pour ce fournisseur est proposé par défaut. A défaut un compte d'attente est proposé. La liste déroulante permet de choisir un compte de charge parmi tous ceux connus dans la base comptable.
Une de nos réalisations pour une concession:
Pour cette application, SPOT a été interfacé avec un logiciel spécifique (VP) qui utilise les données extraites pour les rapprocher d'une base de données et lister les anomalies de facturation.
NB les données extraites pourraient aussi alimenter un logiciel comptable, un ERP ou toute autre application.
 Afficher l'image en taille réelle |
Sur cette copie d'écran, on voit que la page 1 du document scanné (sur la partie droite) est correctement analysée par SPOT : l'identification, l'entête, et les totaux du récapitulatif ont été trouvés. |
 Afficher l'image en taille réelle |
Ici, on voit que la page 2 du document scanné est correctement analysée par SPOT : le tableau détail et le tableau des totaux Contrat/période ont été entièrement renseignés.
|