Angesichts des rasant fortschreitenden Informationszeitalters bietet Ephesoft ein Glossar mit allen Fachbegriffen, die Sie kennen sollten, um intelligente Dokumenten-Automatisierung richtig zu verstehen und zu nutzen.
Adaptive AI
Adaptive AI, zu Deutsch „adaptive KI“, ist eine bestimmte Klasse an Lösungen, die auf künstlicher Intelligenz (KI) basieren. Diese Technologien lernen ständig dazu und „aktualisieren sich selbst“, indem sie historische Daten auswerten und auf neue Datensätze anwenden.
APIs
APIs ist das Akronym für Application Programming Interfaces, die Programmierschnittstellen zwischen Computern und diversen Programmen. APIs ermöglichen es der Software für intelligente Dokumentenverarbeitung, Informationen mit anderen Anwendungen auszutauschen, um einen nahtlosen Datenfluss zwischen den Systemen sicherzustellen.
Künstliche Intelligenz (KI)
Als künstliche Intelligenz werden Technologien bezeichnet, die im großen Maßstab menschliche Intelligenz nachahmen. IDP-Lösungen nutzen verschiedene Arten von KI-gestützter Software, beispielsweise zur Verarbeitung natürlicher Sprache (NLP) und zum maschinellen Lernen (ML), auch als Maschinenlernen oder Machine Learning bezeichnet.
Automation Hero
Personen, die in ihrer Organisation die Hyperautomatisierung vorantreiben, sind für Ephesoft Vorreiter der Automatisierung und werden als Automation Hero bezeichnet. Solche Vorreiter identifizieren gemeinsam mit unseren Spezialisten die richtigen Automatisierungslösungen für die jeweiligen Fragestellungen im Unternehmen und implementieren sie anschließend.
Batch
Auf Deutsch bedeutet Batch so etwas wie „Stapel“. Darunter versteht man eine große Anzahl an Unterlagen oder Dokumenten, die zusammen und nicht einzeln bearbeitet werden sollten. Mit dem Begriff „Batchklasse“ bezeichnet Ephesoft ein Projekt in Transact. Der Begriff „Batchinstanz“ bezieht sich auf eine Aufgabe in Transact.
Klassifikation
Die Klassifikation ist ein wichtiger Schritt, um festzulegen, wie ein bestimmtes Dokument verarbeitet wird. Im Rahmen der IDP bezeichnet die Klassifikation ein Verfahren, bei dem Dokumente anhand der Eigenschaften oder der darin enthaltenen Metadaten identifiziert werden.
Cloud Hybrid
Ein Cloud Hybrid, oder auch eine „Hybrid Cloud“ nutzt sowohl am Standort installierte Ressourcen wie auch eine Public Cloud. Diese Kombination eignet sich für Phasen hoher Auslastung, gewährleistet Skalierbarkeit und minimiert die Anschaffungskosten. Ephesoft hat unter der Bezeichnung Cloud HyperExtender die erste Hybrid-Cloud-Lösung für Dokumentenprozesse eingeführt.
Cognitive Document Processing
Unter Cognitive Document Processing versteht man die Dokumentenverarbeitung mit kognitiven Technologien. Die fortschrittlichsten Arten der IDP-Software, zum Beispiel Ephesoft, arbeiten mit kognitiven Technologien. Diese ahmen mithilfe von KI, maschinellem Lernen und NLP-Tools die kognitiven Fähigkeiten des Menschen nach.
Computer Vision
Computer-Vision-Technologie ist ein Fachgebiet der KI. Anhand von Computer-Vision-Software können Rechner Informationen aus digitalen Videos, Bildern und anderen visuellen Quellen auswerten und Informationen ableiten.
Kontextbezogen
Bestimmte Arten von KI werden als „kontextbezogen“ bezeichnet. Dies bedeutet, dass die Software Dokumente verarbeiten kann, indem sie Zusatzinformationen aus historischen Daten und anderen Quellen berücksichtigt. Dadurch verbessert sie die Genauigkeit und stellt, wie der Begriff schon besagt, Kontext bereit.
Datenextraktion
Unter Datenextraktion versteht man das Verfahren, um Informationen aus physischen und digitalen Dokumenten zu gewinnen. Sobald die Daten einmal extrahiert wurden, lassen sich diverse Geschäftsprozesse leicht automatisieren.
Data of Interest (DOI)
Unter Data of Interest – zu Deutsch „Daten von Interesse“ – versteht man die Ergebnisse adaptiver KI. Diese umfassen alle Datenpaare, die das System eines Anwenders benötigt, um den Kontext zu erschließen oder um zu verstehen, welchen Zweck ein Dokument hat, wie es zu verarbeiten ist und wie es mit der Organisation verknüpft ist.
Day Zero Accuracy (DZA)
Day Zero Accuracy ist ein Maßstab für die Genauigkeit eines Systems am ersten Tag. Dieses Konzept ist hilfreich, um zu verstehen, welche Time to Value ein System hat, wie schnell es sich auszahlt oder welchen ROI es bietet. Durch IDP-Lösungen mit hoher DZA erzielen Unternehmen bei der Dokumentenerfassung hohe Genauigkeit, sobald die Lösung implementiert wurde. Wenn ein System mit äußerst genauen Ergebnissen aktiviert wird, profitiert die Organisation sofort von dessen Vorteilen.
Digitale Transformation
Im Rahmen der digitalen Transformation werden digitale Technologien in alle Geschäftsprozesse eingebunden, um Effizienz und Profitabilität zu steigern.
Document Change Rate (DCR)
Die DCR bezeichnet den Umfang der Änderungen in einem Dokument. Sie gibt an, wie viele Felder während einer manuellen Prüfung korrigiert oder angepasst werden mussten. Die DCR pro Dokument ist die Summe aller Felder, die ein Model bei der Auswertung eines bestimmten Dokuments nicht erkennt. Diese Kennzahl ist ein guter Indikator dafür, wie genau eine IDP-Lösung arbeitet und wie hoch das Konfidenzniveau ist, das dem System zugrunde gelegt werden kann.
Extraktion
Bei Extraktion handelt es sich um die Identifikation und Erfassung bestimmter Indexfelder (Metadaten) in Dokumenten. Beispiele für Indexfelder sind Firmenname, Adresse, Gesamtbetrag und andere.
Field Change Rate (FCR)
Die Field Change Rate gibt an, wie oft ein Feld in einem manuell überprüften Dokument im Durchschnitt geändert werden muss. Sie gibt für jeden Schlüssel (z. B. Rechnungsnummer, Steuerklasse) an, wie oft die Werte hinzugefügt, geändert oder modifiziert werden müssen.
Handwriting Recognition (HWR)
Software zum Erkennen handschriftlicher Informationen ist ein wichtiger Bestandteil der IDP-Technologie. Durch HWR-Tools erkennt die Software handschriftliche Informationen in Dokumenten automatisch und kann sie extrahieren.
Human-in-the-Loop (HITL)
Human-in-the-Loop oder HITL ist ein Verfahren der Informationsverarbeitung, bei dem die Möglichkeiten des Maschinenlernens und die Einbeziehung des Menschen zu größerer Effizienz führen. IDP-Lösungen sollten effiziente HITL-Unterstützung bieten, da KI-gestützte IDP-Plattformen nicht 100 Prozent genau sind und deshalb für Ausnahmen ausgelegt sein müssen.
Hyperautomatisierung
Hyperautomatisierung ist eine Strategie, welche die Identifikation und Automatisierung von möglichst vielen IT- und Geschäftsprozessen beinhaltet. Bei der Hyperautomatisierung werden zahlreiche Technologien, Plattformen und Tools eingesetzt, um eine Automatisierung im großen Maßstab zu erreichen.
Indexierung
Indexierung kam früher zum Einsatz, um eine Datei manuell mit einer bestimmten Markierung zu verknüpfen, sodass sie zu einem späteren Zeitpunkt leicht auffindbar war. Bei IDP-Lösungen läuft dieser Prozess weitgehend automatisiert und Dokumente werden mit größerer Genauigkeit, Effizienz und Geschwindigkeit indexiert.
Erfassung
Die erste Phase der Dokumentenverarbeitung besteht in der Erfassung. Bei der IDP versteht man unter Erfassung das Sammeln von Dokumenten für die Analyse und Datenextraktion.
Integration
Unter Integration versteht man die Vernetzung mehrerer Anwendungen, Geräte, APIs usw. Eine IDP-Lösung wird mit anderen digitalen Ressourcen verknüpft, damit Prozessautomatisierung und Informationsaustausch zwischen den Lösungen möglich sind.
Integration Engine
Eine Integration Engine empfängt Daten aus der Systemlandschaft, modifiziert diese und leitet sie an andere Anwendungen weiter.
Intelligente Automatisierung
Bei der intelligenten Automatisierung werden redundante Prozesse mithilfe von KI-Technologien automatisiert. In ihrer Gesamtheit ermöglichen diese Technologien, dass Unternehmen ihre Handlungs- und Entscheidungsprozesse straffen.
Intelligente Erfassung
Bei IDP-Technologie kommt intelligente Erfassung zum Einsatz, um wichtige Informationen in elektronischen Dateien und Dokumenten in Papierform zu identifizieren und automatisch zu extrahieren. Das Eingreifen des Menschen ist nur in Ausnahmefällen erforderlich.
Intelligente Zeichenerkennung (Intelligent Character Recognition / ICR)
Mithilfe der ICR lernen IDP-Lösungen, unterschiedliche Typenschriften und Handschriften zu unterscheiden. Dadurch wird die Verarbeitung genauer und handschriftliche Informationen werden besser erkannt.
Intelligente Dokumentenverarbeitung (Intelligent Document Processing / IDP)
IDP ist ein Softwaredienst, der mithilfe von Technologien zur Datenerfassung wichtige Daten aus digitalen und physischen Dokumenten automatisch extrahiert.
iPaaS (Integration Platform as a Service)
Bei iPaaS handelt es sich um eine Plattform, mit der die Integration von Anwendungen unternehmensweit standardisiert wird. Mithilfe der iPaaS können Organisationen ihre verschiedenen SaaS-Anwendungen (Software as a Service) integrieren.
Schlüssel-Wert
Schlüssel-Werte sind eine Möglichkeit, nicht relationale Daten in Gruppen, oder auch als Schlüssel-Wert-Paare, zu speichern. Mit diesem Verfahren können Organisationen riesige Datenmengen speichern.
Knowledge Graphs
Dieser Fachbegriff bezieht sich auf eine Wissensdatenbank für allgemeine Zwecke und wird häufig in Bereichen wie Wissensrepräsentation, Wissensakquisition, Verarbeitung natürlicher Sprache, Ontology Engineering und in Bezug auf das semantische Web verwendet.
Ein Knowledge Graph repräsentiert eine Sammlung von Entitäten oder Daten von Interesse, gibt an, wie diese in Beziehung zueinander stehen, und liefert Informationen über sie, die auch als Metadaten bezeichnet werden. Knowledge Graphs werden heutzutage häufig eingesetzt, von Suchmaschinen und Chatbots über Produktempfehlungen, kognitive Automatisierung und andere KI-gestützte Dienste.
Abgleich von Rechnungspositionen
Der Abgleich von Rechnungspositionen ist eine Funktion bei IDP-Lösungen. Diese Technologien können sicherstellen, dass Rechnungen und Bestellungen – oder vergleichbare Dokumentensätze – übereinstimmen.
Maschinelles Lernen (ML)
Maschinelles Lernen, auch als Maschinenlernen oder Machine Learning bezeichnet, ist ein Gebiet der Informatik und ein Teilbereich der KI, das sich mit lernenden, adaptiven Algorithmen befasst. Technologien für maschinelles Lernen entwickeln sich mit der Zeit weiter und werden dabei genauer und effizienter.
Metadaten
Bei Metadaten handelt es sich um beschreibende Informationen zu bestimmten Daten. Manche Metadaten enthalten beispielsweise Angaben darüber, wer eine Datei verfasst hat, wann oder wie sie erstellt wurde, worum es darin geht und dergleichen.
Natural Language Processing (NLP)
Natural Language Processing, zu Deutsch „Verarbeitung natürlicher Sprache“, ist ein Prozess, bei dem die natürliche Sprache in physischen und digitalen Dokumenten verarbeitet wird.
Normalisierung / normalisiert / Normalisieren
Technologien für Maschinenlernen müssen Daten normalisieren, damit sie nutzbar werden. Normalisierung wird gelegentlich auch als „Datenbereinigung“ bezeichnet. Normalisierte Daten erscheinen in unterschiedlichen Feldern und Datensätzen, sodass die Software sie entsprechend verarbeiten kann.
Optische Zeichenerkennung (Optical Character Recognition / OCR)
Optische Zeichenerkennung – auch OCR-Software bzw. OCR-Dienste genannt – erkennt Text in Bildern und wandelt diesen in maschinell kodierten Text mit Informationen zu dessen Position um. Somit können diese Rohdateien weiterverarbeitet werden, z. B. im Rahmen einer Analyse des Texts, um verwertbare Daten zu extrahieren.
Optische Markierungserkennung (Optical Mark Recognition / OMR)
Während OCR-Technologie geschriebenen Text und Bilder erkennt, liest Optical Mark Recognition, zu Deutsch „optische Markierungserkennung“, Informationen aus, die in Tests, Fragebögen und dergleichen markiert sind, wie etwa angekreuzte Kontrollkästchen. Mithilfe von OMR-Technologie werden beispielsweise Multiple-Choice-Tests und ähnliche Dokumente verarbeitet.
Perfect Recall Documents (PRD)
Hierbei handelt es sich um Dateien, die mit perfekter Genauigkeit bearbeitet wurden. Um als PRD-Dateien zu gelten, müssen Dokumente bei einer Suche in einer Datenbank mit hundertprozentiger Genauigkeit gefunden oder abgerufen werden können.
Post-Processing
Beim Post-Processing handelt es sich um die letzte Phase der IDP. In dieser werden die extrahierten Daten mithilfe einer Reihe von Validierungsregeln und KI-gestützten Prozessen untersucht.
Pre-Processing
Das Pre-Processing ist die erste Phase der IDP. In dieser Phase wird die Qualität der Dokumente verbessert, damit sie genauer klassifiziert und analysiert werden können.
Recall
Der Recall gibt an, wie viele der in einer Datenbank vorhandenen relevanten Dokumente bei einer Suche auch tatsächlich gefunden wurden.
Repository
Ein Repository ist ein mögliches Ablagesystem für Dokumente.
Robotic Processing Automation (RPA)
Robotic Processing Automation – auch als robotische Prozessautomatisierung bezeichnet – ist eine Technologie, die wiederkehrende Geschäftsprozesse mithilfe von Bots, der Digital Workforce oder robotischen Systemen automatisiert. Diese Software kann programmiert werden, um eine Fülle an redundanten Aufgaben zu übernehmen.
Semantische Daten
Semantischen Daten sind mehr als nur eine einzelne Information. Sie umfassen auch Aussage und Absicht der Daten. Es ist das tiefgreifende, mehrdimensionale Verstehen von Daten und der Beziehungen zwischen den Entitäten. Das Verstehen semantischer Daten kann zu schnelleren Erkenntnissen mittels KI und maschinellem Lernen führen.
Semantische Technologien
Sogenannte semantische Technologien unterstützen Software dabei, unterschiedliche Datentypen besser zu verstehen. Diese Technologien sind integraler Bestandteil von Maschinenlernen und Automatisierung. Sie werden häufig eingesetzt, um Knowledge Graphs zu erstellen und einzusetzen.
Semistrukturierte Daten
Als semistrukturierte Daten bezeichnet man Informationen, die keinen bestimmten Datenmodellen entsprechen, die jedoch über eine allgemeine Struktur verfügen, wie Tags oder andere Identifizierungsmerkmale. Semistrukturierte Daten haben eine Struktur, die für das Auge erkennbar sein mag, doch von einem Computersystem nicht leicht verarbeitet werden kann.
Straight-Through Processing (STP)
Straight-Through Processing ist dann der Fall, wenn ein automatisierter Prozess ohne manuelles oder menschliches Eingreifen ausgeführt werden kann. STP gibt an, wie genau und effizient ein System für intelligente Dokumentenverarbeitung ist und wie viel manuelle Validierung und Eingreifen des Menschen erforderlich sind.
Strukturierte Daten
Bei strukturierten Daten handelt es sich um klar definierte Gruppen an Informationen, die leicht durchsucht oder abgefragt werden können, da sie wiederkehrenden Mustern entsprechen.
Unstrukturierte Daten
Unstrukturierte Daten umfassen alle Informationen, die keinem formellen Muster oder Datenmodell entsprechen. Diese Daten können nicht leicht durchsucht werden und umfassen in der Regel Audiodateien, E-Mails, physische Dokumente, Faxdokumente, PDF-Dateien usw.
Validierung
Im Rahmen der Validierung wird bestätigt, ob die aus Dokumenten erhobenen Informationen genau und korrekt sind. Die Validierung kann manuell oder mithilfe von KI-Technologien erfolgen.
Workflow-Automatisierung
Die Automatisierung von Workflows besteht in der systematischen Konzeption und Automatisierung einer Reihe von Aufgaben. Mithilfe der Workflow-Automatisierung lassen sich Produktivität und Effizienz erhöhen. Unternehmen können durch die Workflow-Automatisierung zum Beispiel automatisch wichtige Dokumente erstellen, Aufgaben zuweisen, die Dokumente unterzeichnen und Daten an verschiedene Systeme verteilen.
>> Kennen Sie ein weiteres Wort oder eine Definition, die wir Ihrer Meinung nach in dieses Glossar aufnehmen sollten? Dann kontaktieren Sie uns.