La capture de données manuscrites s’avère compliquée pour la plupart des organisations, c’est la raison pour laquelle nous abordons ici les cinq facteurs principaux à prendre en compte lors de toute initiative de transformation digitale ayant trait aux données et documents manuscrits. Ephesoft propose en outre de nouvelles fonctionnalités de reconnaissance de caractères manuscrits qui seront disponibles dans la prochaine version de Ephesoft Transact.

L’importance de la flexibilité de la capture de contenu

On pense souvent que seuls les formulaires normalisés et figés contiennent des données manuscrites. C’est omettre les processus administratifs et les formulaires en ligne qui ne sont pas remplissables directement et que l’on rencontre dans le secteur commercial. Selon la version du formulaire, la qualité de la numérisation du formulaire rempli, le type de logiciel utilisé pour convertir les fax en pdf, et bien d’autres paramètres, la présentation de l’information contenue dans le formulaire varie. En raison de ces paramètres, l’extraction de données à l’aide de modèles ne marche tout simplement pas.

Selon l’extrapolation d’un sondage mené par l’AIIM (Association for Intelligent Information Management, Association pour la gestion intelligente de l’information) auprès environ 300 répondants, plus d’un quart des organisations utilisent des formulaires et documents contenant des données manuscrites dans le cadre de leurs processus métier fondamentaux. Ceci inclut les processus qui ont été automatisés, ou que l’on a cherché à automatiser, à l’aide d’outils tels que les systèmes RPA et les applications BPM.

  • 26 % des organisations dépendent de formulaires et documents contenant des données manuscrites pour leurs processus métier fondamentaux.
  • 42 % des organisations qui utilisent des formulaires pour recueillir des informations et recevoir des demandes constatent que la moitié des formulaires contiennent des données manuscrites.

Les informations envoyées au format manuscrit sont encore aujourd’hui la norme plutôt que l’exception, aussi bien dans le secteur public que dans le secteur privé.

La prise en compte des goulets d’étranglement

Le secteur public est l’un des principaux coupables des goulets d’étranglement observés au sein des processus impliquant des données manuscrites. La plupart des services publics proposés aux citoyens impliquent l’envoi de formulaires. Que vous interagissiez avec un interlocuteur régional, départemental ou local, le budget consacré et l’adoption de la technologie entrent clairement en jeux. Pensez à l’état du budget de fonctionnement de votre canton à la suite de la pandémie actuelle. Puis pensez aux processus tels que les demandes de permis de construire, les demandes d’information, les demandes d’allocation, les reports d’impôts et autres demandes. En raison du personnel limité, des congés accordés et de la capacité de travail globale diminuée, les services publics vont se retrouver submergés par une accumulation de saisies manuelles de données en retard relatives à toutes ces sollicitations des citoyens.

Toutefois, le secteur commercial n’est pas non plus à l’abri du trou noir informationnel qui entoure les données manuscrites. Par exemple, les compagnies d’assurance acceptent que les souscripteurs envoient leurs formulaires de déclaration de sinistre au format manuscrit. Ou encore, rappelez-vous toutes les fois où vous avez consulté votre médecin traitant et avez dû remplir le formulaire de mise à jour de vos coordonnées personnelles et des informations relatives à votre couverture médicale en salle d’attente, en présence de tous les autres patients malades. Vous avez peut-être dû subir un test virologique de dépistage de la COVID-19 ou un test sérologique de recherche d’anticorps, ce qui a nécessité le remplissage de formulaires à la main. Toutes ces informations sont cruciales et doivent être disponibles dans un format numérique interrogeable afin d’être exploitables.

L’utilisation d’une plateforme de capture intelligente

Le flux de travail interne de l’application Ephesoft Transact suit les étapes suivantes. Le contenu se déplace du point de capture de documents (ou point d’ingestion de documents) soit via le flux de travail d’un système externe, soit via un flux de travail autonome, vers le point de distribution des documents traités et de leurs métadonnées et valeurs indexées associées vers leur destination finale ou la prochaine étape du processus métier.

Ephesoft Transact propose une nouvelle fonctionnalité d’extraction de données très intéressante, qui est principalement fondée sur la reconnaissance de caractères manuscrits (ou ICR, pour Intelligent Character Recognition) et la reconnaissance optique de marques (ou OMR pour Optical Mark recognition). L’ICR convertit les images contenant le texte manuscrit dans un format de fichier éditable et/ou interrogeable. Les moteurs d’ICR traditionnels varient en termes de précision et d’exigences serveur, et de nouveaux moteurs d’ICR disponibles dans le cloud et dont l’apprentissage est basé sur le machine learning arrivent régulièrement sur le marché. L’OMR capture les données d’éléments de formulaire comme les cases à cocher et les bulles de choix multiple.

Grâce au Feature Pack Ephesoft Transact 2020.01, les utilisateurs finaux pourront configurer des règles d’extraction de données manuscrites non structurées et la détection de signature depuis l’interface administrative Transact, sans surcoût.

5 facteurs de succès d’un projet de transformation digitale

Selon un rapport PTC à propos de la transformation digitale, les cadres d’entreprise déclarent que les principaux avantages de telles initiatives de transformation digitale sont l’augmentation de l’efficience opérationnelle – essentielle à la réduction des budgets des TI, la diminution du temps nécessaire à la commercialisation de nouveaux produits et services, et le comblement de l’écart entre les attentes des clients et l’offre de l’entreprise. Et pour la plupart des organisations, les données manuscrites sont indissociables d’une approche holistique de l’automatisation. Abordons donc les cinq principaux facteurs de succès d’un projet de transformation digitale impliquant des données manuscrites.

  1. Source de document

    Commençons par la source de contenu. De quelle manière recevez-vous les documents contenant des données manuscrites ? Cela sera variable selon le secteur et le processus, mais c’est important pour le flux de travail global et pour le succès ou la capacité de traitement de votre projet d’extraction de données automatisée. Les documents vous parviennent-ils par fax, par email, par voie postale au niveau d’une salle de tri de courrier centralisée, ou encore, par téléchargement des images des formulaires et lettres manuscrits sur un portail d’entreprise à partir de photos prises avec des dispositifs mobiles ? Ces méthodes de réception des documents – jusqu’alors reçus au format papier – au sein des systèmes d’information de l’organisation doivent être rassemblées et toute confluer vers un processus centralisé visant à garantir une uniformité de traitement et à optimiser vos processus métier centrés sur les documents.

    Notre application Ephesoft Transact nous permet fort heureusement d’offrir l’ingestion de documents provenant de toutes ces diverses sources, voire même de proposer une application mobile qui s’intègre dans votre application d’entreprise via SDK ou qui s’utilise de manière autonome, afin de distribuer le contenu capturé sur le terrain et à la volée .

  2. Sécurité

    Le deuxième facteur à prendre en compte pour réussir une transformation digitale impliquant des documents contenant des données manuscrites est l’ensemble des exigences de sécurité de votre organisation ou secteur d’activité. Devez-vous satisfaire à des exigences de sécurité spécifiques en matière d’accès depuis des applications dans le cloud public ou d’intégration dans de telles applications ?

    Le moteur d’ICR clé en main de Ephesoft Transact peut s’installer localement sur les serveurs de l’entreprise ou dans un cloud privé. Il n’est donc pas nécessaire d’envoyer des informations sensibles ou des données clients hors du réseau et du pare-feu de l’organisation pour bénéficier des nombreux atouts de l’ICR.

  3. Degré de complexité et fluctuations

    Ephesoft Transact utilise des paires clé – valeur de champ pour identifier et extraire les informations des documents non structurés. Cela signifie que l’application recherche un motif de texte particulier représentant la clé, puis trouve la valeur correspondante d’après la relation attendue entre la clé et la valeur de champ à extraire. Cette approche permet de ne pas avoir à configurer de modèles par type de documents pour extraire les données, et est utilisable pour les données manuscrites.

    Cela signifie également que Ephesoft Transact sait détecter une portion de texte manuscrit sur une page en utilisant cette logique de paires clé – valeur de champ, et l’envoyer ensuite vers un moteur d’ICR tiers dans le cloud ou ailleurs, afin d’en récupérer la valeur convertie. Il convient de noter que l’utilisation d’un moteur d’ICR tiers peut représenter un coût supplémentaire. En effet, de nombreux fournisseurs d’ICR utilisent une tarification au nombre de champs capturés.

    Ephesoft Transact intègre le moteur d’ICR Recostar, et l’extraction de données manuscrites ne représente donc pas de coût supplémentaire pour vous ou vos clients, que la tarification soit au nombre de champs capturés ou au nombre de pages traitées.

    De nombreux produits de capture vous imposent de créer des formulaires ou modèles figés pour extraire les données manuscrites des documents numérisés. Si votre projet n’implique qu’un seul formulaire et qu’une seule version de ce formulaire, ceci ne pose pas de problème d’un point de vue de la configuration et de la gestion de tels formulaires ou modèles. Mais qu’en est-il si diverses versions de ce formulaire existent ? Le formulaire est peut-être actualisé ou enrichi chaque année. Et qu’en est-il si le formulaire varie selon la région ?

    Prenons l’exemple de ces trois formulaires régionaux d’exonération fiscale. Ils permettent tous de recueillir les mêmes informations, mais leur mise en page est différente.

    Vous devez maintenant prendre en compte la source de document et son impact éventuel sur la présentation des documents. Numériser un formulaire à l’aide d’un dispositif mobile peut par exemple impacter le rapport hauteur/largeur de l’image numérique. En outre, lors de la numérisation de documents papier, les documents sont parfois mal positionnés sur le plateau du scanner, ce qui modifie les coordonnées des différentes zones des documents. Il en est de même en cas de distorsions dues à l’envoi d’un document par fax. Si vous basez la capture des informations manuscrites sur des zones figées sur la page, votre capacité à gérer les cas réellement rencontrés lors de votre projet de transformation digitale sera limitée.

  4. Détection des signatures

    Le quatrième facteur de réussite d’un projet de transformation digitale impliquant des données manuscrites est la prise en charge des signatures apposées sur les documents. La détection des signatures peut s’avérer très manuelle et chronophage, et peut donc ralentir le traitement des demandes, tous secteurs confondus.

    Prenons l’exemple du marché du prêt financier. Le formulaire harmonisé de demande de prêt immobilier est généralement l’un des éléments du dossier constitué pour toute demande de prêt, et ce dernier peut varier en nombre de pages et degré de complexité. Il est crucial de valider que tout emprunteur et co-emprunteur a bien signé. Mais lorsqu’un humain entre en action, il passe du temps à parcourir les pages pour identifier ce champ de signature et donner son feu vert pour le dossier. L’automatisation de cette étape constitue un gain de temps et par conséquent un gain d’argent lors du processus de prêt.
    Un autre exemple est le processus d’examen des antécédents personnels. Ou l’intégration des nouveaux employés. Chaque secteur d’activité et chaque entreprise utilise un processus d’embauche, au cours duquel les personnes doivent signer des documents, formulaires ou lettres d’explication. Et la mise en place de vérifications automatisées dans le cadre de ces tâches omniprésentes permet d’économiser beaucoup de temps. D’où l’importance de ce facteur lors des initiatives de transformation digitale.

  5. OCR, ICR ou OMR – Extraire l’utile

    Dernier facteur, sachez si les données pertinentes sont dactylographiées, manuscrites, présentées avec des marques optiques comme les cases à cocher ou les boutons radio, ou encore, une combinaison de ces types. On me demande souvent d’extraire tous les champs d’un formulaire ou d’un document. Mais lorsque j’en demande la raison, lorsque je demande l’utilité de ces informations en aval, je ne reçois aucune réponse. Limitez la portée de votre projet aux strictes données pertinentes, qu’il s’agisse d’une signature sur un contrat, d’une case à cocher sur un formulaire, de données dactylographiées ou manuscrites, cela impactera positivement le délai et le coût de réalisation de votre projet.

Ce qu’il faut retenir

En résumé, les éléments à ajouter à votre liste d’initiatives de transformation digitale sont : la prise en compte des sources de contenu, l’examen des exigences de sécurité relatives à la transmission des données hors du réseau et du pare-feu de l’organisation, l’étude de la complexité et de la variété des formulaires et documents, la sélection des flux de travail nécessitant la validation des signatures, et la bonne compréhension des exigences du processus métier à exécuter en termes d’extraction de données par OCR, ICR et OMR.

Pour regarder le replay du webinaire, cliquez ici.