Avec l’évolution rapide de l’ère de l’information, Ephesoft vous propose un glossaire qui recense tous les termes que vous devez connaître pour comprendre et utiliser l’automatisation intelligente des documents.
IA adaptative
L’IA adaptative est une catégorie spécifique de solutions d’intelligence artificielle. Ces technologies peuvent apprendre en permanence et se mettre à jour en analysant les données passées et en les appliquant à de nouveaux ensembles de données.
API
Les API ou interfaces de programmation d’applications servent de connexions entre les ordinateurs et différents programmes. Les API permettent aux logiciels de traitement intelligent des documents de partager des informations avec d’autres applications pour faciliter un flux continu entre différents systèmes.
Intelligence artificielle (IA)
L’intelligence artificielle renvoie aux technologies qui miment l’intelligence humaine à grande échelle. Les solutions IDP utilisent différents logiciels d’IA, tels que le traitement automatique des langues (TAL) et l’apprentissage automatique (AA).
Champion de l’automatisation
Chez Ephesoft, un champion de l’automatisation est une personne qui est à l’origine des efforts d’hyperautomatisation au sein de son entreprise. Elle travaille avec nos experts pour identifier et mettre en œuvre les solutions d’automatisation qui correspondent aux besoins de son organisation.
Lot
Un lot est un ensemble important d’enregistrements ou de documents qui doivent être traités conjointement, plutôt que séparément. Chez Ephesoft, une « classe de lots » fait référence à un projet dans Transact. Une « instance de lots » fait référence à une tâche dans Transact.
Classification
La classification est une étape essentielle pour déterminer comment traiter un document. Dans le cadre de l’IDP, elle correspond au processus d’identification d’un document en fonction de ses caractéristiques ou des métadonnées qu’il contient.
Nuage hybride
Un nuage hybride est un environnement informatique qui exploite à la fois des ressources sur site et un cloud public. Cette combinaison offre une performance optimale, une modularité et un investissement initial minimum. Ephesoft a lancé la première plateforme de nuage hybride pour le traitement de documents, appelée Cloud HyperExtender.
Traitement cognitif des documents
Les logiciels IDP les plus avancés, comme ceux proposés par Ephesoft, effectuent un traitement cognitif des documents. Cette technologie imite les capacités cognitives des humains en utilisant l’IA, l’apprentissage automatique et les outils de TAL.
Vision par ordinateur
La technologie de vision par ordinateur est un domaine de l’IA. Les logiciels de vision par ordinateur permettent aux ordinateurs d’analyser et d’obtenir des informations provenant de vidéos numériques, d’images ou d’autres sources visuelles.
Contextuel
Certains types de logiciels d’IA sont décrits comme « contextuels ». Cela signifie que le logiciel peut traiter des documents en utilisant des informations supplémentaires provenant de données existantes et d’autres sources pour améliorer sa précision et, comme son nom l’indique, fournir du contexte.
Extraction de données
L’extraction de données consiste à récupérer des informations à partir de documents physiques ou numériques. Une fois extraites, les données peuvent faciliter l’automatisation de différents processus opérationnels.
Données intéressantes (DOI)
Ces données résultent de l’IA adaptative. Elles englobent toutes les paires de données qu’un utilisateur ou un système utilisera pour identifier le contexte, comprendre l’objectif du document, décider comment le traiter et comment l’associer à l’entreprise.
Précision au jour zéro (DZA)
La précision au jour zéro mesure la précision d’un système au premier jour. Elle permet de comprendre le délai de rentabilité et la rapidité avec laquelle un système commencera à produire de la valeur ou un retour sur investissement. Les solutions IDP dotées d’une DZA élevée permettent aux entreprises de commencer à recueillir des résultats de grande précision dès leur mise en œuvre. Un système qui produit des résultats extrêmement précis dès son activation apporte des bénéfices immédiats à une entreprise.
Transformation numérique
La transformation numérique consiste à intégrer des technologies dans toutes les pratiques opérationnelles afin d’augmenter l’efficacité et la profitabilité.
Numérisation vs digitalisation
La numérisation consiste à convertir des documents et des images spécifiques dans un format numérique. En revanche, la digitalisation est un terme plus large qui fait référence à l’acte d’abandonner les systèmes analogiques.
Taux de modification d’un document (DCR)
Le DCR mesure le nombre de champs qui doivent être corrigés ou révisés lors d’une vérification manuelle. Le DCR par document est le nombre total de champs que le modèle ne parvient pas à prédire dans un document donné. C’est un bon indicateur de la précision d’une solution IDP et du niveau de confiance que l’on peut accorder au système.
Extraction
L’extraction est le processus qui consiste à identifier et à recueillir des champs d’index spécifiques (métadonnées) dans les documents. Ces champs indexés peuvent par exemple être le nom de l’entreprise, l’adresse, le montant total, etc.
Taux de modification d’un champ (FCR)
Le taux de modification d’un champ est le nombre moyen de fois qu’un champ est révisé dans un document vérifié à la main. Pour chaque clé (par ex. NuméroFacture, TauxTVA), combien de fois les valeurs doivent-elles être ajoutées ou modifiées ?
Reconnaissance de l’écriture manuscrite (HWR)
Le logiciel de reconnaissance de l’écriture manuscrite est un élément important de la technologie IDP. Les outils de HWR permettent au logiciel de reconnaître automatiquement et d’extraire des informations de documents manuscrits.
Intervention humaine (HITL)
L’intervention humaine ou HITL est une méthode de traitement de l’information qui utilise une combinaison de capacités d’apprentissage automatique et de contribution humaine afin d’améliorer son efficacité. Les solutions IDP doivent offrir une assistance HITL efficace, car les plateformes IDP basées sur l’IA ne sont pas précises à 100 % et doivent tenir compte des exceptions.
Hyperautomatisation
L’hyperautomatisation est une stratégie qui consiste à identifier et automatiser autant de processus informatiques et opérationnels que possible. L’hyperautomatisation utilise de multiples technologies, plateformes et outils pour faciliter cette automatisation à grande échelle.
Indexation
L’indexation est une approche traditionnelle qui consiste à associer manuellement un fichier à une balise spécifique pour pouvoir le retrouver facilement à l’avenir. Les solutions IDP ont automatisé l’essentiel de ce processus et permettent d’indexer les documents avec plus de précision, d’efficacité et de rapidité.
Ingestion
L’ingestion est la première phase de traitement des documents. L’ingestion IDP est le processus qui consiste à accumuler des documents pour analyser et extraire des données.
Intégration
L’intégration est le processus qui consiste à interconnecter plusieurs applications, appareils, API, etc. Une solution IDP s’intègre à d’autres ressources numériques pour permettre l’automatisation du processus et la possibilité de partager des informations entre les solutions.
Moteur d’intégration
Un moteur d’intégration reçoit des données de plusieurs systèmes, modifie ces informations et les relaye aux autres applications.
Automatisation intelligente
L’automatisation intelligente consiste à automatiser les processus redondants à l’aide de technologies d’IA. De plus, ces technologies permettent aux entreprises de rationaliser leurs processus de décision.
Capture intelligente
La technologie IDP utilise la capture intelligente pour identifier et extraire automatiquement les informations essentielles des documents électroniques et papier, sans intervention humaine autre que la gestion des exceptions.
Reconnaissance intelligente des caractères (ICR)
L’ICR permet aux solutions IDP d’apprendre plusieurs polices de caractère et styles d’écriture manuscrite au fil du temps. Cela augmentera la précision du processus et sa capacité à reconnaître l’écriture manuscrite.
Traitement intelligent des documents (IDP)
L’IDP est un service logiciel qui extrait les données importantes de documents numériques et physiques grâce à une technologie de capture des données.
iPaaS (plateforme d’intégration en tant que service)
L’iPaaS est une plateforme qui standardise l’intégration des applications au sein de toute une entreprise. Une iPaaS est conçue pour aider les entreprises à intégrer leurs diverses applications SaaS (logiciel en tant que service).
Clés-valeurs
Les clés-valeurs sont un moyen de stocker des données non relationnelles par groupes ou par paires de clés-valeurs. Cette méthode permet aux entreprises de stocker une très importante quantité de données.
Cartes de connaissances
Ce terme renvoie à une base de connaissances généraliste. Il est communément utilisé dans des domaines comme la représentation et l’acquisition des connaissances, le traitement automatique des langues, l’ingénierie ontologique et le web sémantique.
Une carte de connaissances représente un ensemble d’entités ou de données intéressantes, ainsi que la manière dont ces entités sont liées et les informations les concernant, connues sous le nom de métadonnées. Aujourd’hui, les cartes de connaissances sont largement utilisées dans tous les domaines, des moteurs de recherche aux agents conversationnels en passant par les prescripteurs de produits, l’automatisation cognitive et d’autres services basés sur l’IA.
Rapprochement de postes
Le rapprochement de postes est une fonction de l’IDP et des solutions d’hyperautomatisation. Ces technologies assurent que les factures et les bons de commande, ou d’autres séries de documents correspondants, sont bien rapprochés.
Apprentissage automatique (AA)
L’apprentissage automatique est une discipline des sciences informatiques et un sous-groupe de l’IA qui consiste à utiliser des algorithmes capables d’apprendre et de s’adapter. Les technologies d’apprentissage automatique évoluent au fil du temps pour devenir plus précises et plus efficaces.
Métadonnées
Les métadonnées sont des informations descriptives concernant certaines données. Par exemple, l’auteur du fichier, la date et le lieu de sa création, son sujet ou autre.
Traitement automatique des langues (TAL)
Les technologies de traitement automatique des langues peuvent traiter et analyser les langues contenues dans les documents physiques et numériques.
Normalisation/normalisé/normaliser
Les technologies d’apprentissage automatique doit normaliser les données pour les rendre utilisables. Le processus de normalisation est parfois appelé « nettoyage des données ». Les données normalisées apparaissent similaires dans différents champs et enregistrements afin que le logiciel puisse les traiter de manière adéquate.
Reconnaissance optique de caractères (OCR)
Les logiciels ou services d’OCR convertissent les images brutes d’un texte en texte encodé par une machine, avec des informations de positionnement, afin que ces fichiers bruts puissent être traités ultérieurement, par exemple, en analysant le texte pour en extraire des données utiles.
Reconnaissance optique de marques (OMR)
Alors que la technologie OCR « lit » les textes écrits et les images, le logiciel OMR reconnaît les informations marquées sur les tests, les enquêtes, etc., comme les cases à cocher. La technologie OMR est utilisée pour traiter des QCM ou des documents similaires.
Documents à rappel parfait (PRD)
Les documents à rappel parfait sont des fichiers qui ont été traités avec une précision parfaite. Pour être considérés comme des fichiers PRD, ils doivent pouvoir être rappelés ou retrouvés avec une précision de 100 %.
Post-traitement
Le post-traitement est la dernière étape de l’IDP. Au cours de cette phase, les données extraites sont examinées à l’aide d’un ensemble de règles de validation et de processus basés sur l’IA.
Prétraitement
Le prétraitement est la première étape de l’IDP. Au cours de cette phase, la qualité des documents est améliorée afin de les classer et les analyser avec plus de précision.
Rappel
Le rappel est la mesure d’un modèle ou d’un système qui identifie correctement les vrais positifs.
Dépôt
Un dépôt est l’un des lieux de stockage possibles de documents.
Automatisation robotisée des processus (RPA)
L’automatisation robotisée des processus est une technologie qui sert à automatiser les processus opérationnels répétitifs à l’aide de bots, de travailleurs numériques ou de robots. Ce logiciel peut être programmé pour effectuer un large éventail de tâches redondantes.
Données sémantiques
Les données sémantiques ne sont pas simplement des données. Elles comprennent le sens et l’intention qui entourent les données. Il s’agit de la compréhension profonde et multidimensionnelle des données et des relations entre les entités. Comprendre les données sémantiques peut permettre une connaissance accélérée grâce à l’IA et à l’apprentissage automatique.
Technologies sémantiques
Les technologies sémantiques sont conçues pour aider les logiciels informatiques à mieux comprendre les différents types de données. Ces technologies font partie intégrante de l’apprentissage automatique et de l’automatisation, et sont souvent utilisées pour créer et déployer des cartes de connaissances.
Données semi-structurées
Les données semi-structurées sont des informations qui ne se conforment pas à des modèles de données spécifiques, mais possèdent une structure générale, comme des balises ou d’autres marqueurs d’identification. Les données semi-structurées ont une structure perceptible par l’œil humain, mais pas forcément aisée à traiter par un système informatique.
Traitement au fil de l’eau (STP)
On parle de traitement au fil de l’eau lorsqu’un processus automatisé peut être exécuté sans aucune intervention manuelle ou humaine. Le STP permet de mesurer la précision et l’efficacité d’un système de traitement intelligent des documents, en fonction de la quantité de validation et d’intervention manuelles nécessaires.
Données structurées
Les données structurées sont des groupes d’informations clairement définis, qui peuvent être facilement recherchés ou interrogés, de par leurs schémas répétitifs.
Données non structurées
Les données non structurées regroupent toutes les informations qui ne suivent pas un schéma formel ou un modèle de données. Ces données ne peuvent pas être facilement recherchées. Elles incluent le plus souvent des fichiers audio, des e-mails, des documents physiques, des fax, des PDF, etc.
Validation
La validation est le processus qui consiste à confirmer que les informations recueillies dans les documents sont précises et correctes. La validation peut être réalisée manuellement ou à l’aide de technologies d’IA.
Automatisation du processus de travail
L’automatisation du processus de travail fait référence au processus de conception et d’automatisation systématique d’une série de tâches spécifiques. L’automatisation du processus de travail peut être utilisée pour augmenter la productivité et l’efficacité. Par exemple, l’automatisation du processus de travail permet aux entreprises de générer automatiquement des documents essentiels, d’attribuer des tâches, de signer ces documents et de diffuser les données dans plusieurs systèmes.
>> Vous pensez à d’autres mots ou définitions que vous voudriez nous soumettre ? Contactez-nous ici