Intelligente, datenbasierte Entscheidungen dank RPA-Lösung kombiniert Smart Capture
Rückblickend lässt sich sagen, dass File-Sharing den Weg für Anwendungen im Dokumentenmanagement geebnet hat. Diese Anwendungen führten wiederum zu cloudbasierten Systemen für das Informationsmanagement. Davon ausgehend ermöglichten Cloud-Computing und der Zugriff auf Inhalte aus der Ferne die Analyse großer Datenbestände, oder auch Big Data Analytics. Der Bedarf nach Prozessautomatisierung hat dazu geführt, dass im Rahmen robotischer Prozessautomatisierung (RPA) Tools für die Dokumentenerfassung nachgefragt wurden, mit deren Hilfe sich Inhalte interpretieren und für digitale Workflows bereitstellen lassen. Nachdem innovative Technologien den Weg zu datenbasierten Erkenntnissen und zur Automatisierung ebnen, realisieren Unternehmen, wie wichtig die in textlicher Form vorliegenden Daten in ihren Dokumenten und Aktenschränken sind.
Bei den meisten RPA-Systemen werden robotergesteuerte Prozesse mit Dokumentenintelligenz ausgestattet, indem bei der Zeichenerkennung herkömmliche OCR-Tools zum Einsatz kommen. In einer kürzlich veröffentlichten Marktstudie zu RPA-Systemen stellt Gartner die These auf, dass „OCR für den Kern der RPA nebensächlich“ ist. Wenn das Ziel jedoch darin besteht, manuelle durch robotische Prozesse zu ersetzen, bleibt herkömmliche OCR nur an der Oberfläche der Dokumentenintelligenz. Für echte Prozessautomatisierung ist die intelligente Erfassung von Inhalten, oder auch Smart Capture, erforderlich – die Weiterentwicklung der OCR-Technologie auf Basis künstlicher Intelligenz.
Wenn ich mit Unternehmen im Rahmen der digitalen Transformation oder der Dokumentenprozesse an Automatisierungsprojekten arbeite, beantworte ich regelmäßig folgende Frage: „Brauchen wir wirklich ein eigenes Erfassungstool? Warum können wir nicht einfach die optische Zeichenerkennung /das OCR-Tool / das Visual Business Object der RPA-Anwendung nutzen? Mir fällt eine Begebenheit ein, bei der ich mir bei einem Projekt zu Hause eine ähnliche Frage stellte. Als ich vor der getäfelten Wand stand – mit dem Bilderrahmen zu meinen Füßen, der Wasserwaage in einer Hand und dem Nagel in der anderen –, merkte ich, dass ich den Hammer in der Garage vergessen hatte. „Warum nehme ich nicht einfach den Griff des Schraubendrehers, um den Nagel in die Wandverkleidung zu schlagen?“ Wenn es sich um weiches Holz handelt, der Nagel scharf ist und der Schraubendreher präzise geführt wird, ist es möglich. Wenn jedoch andere Bedingungen herrschen, stellt man schnell fest, dass dieses improvisierte Ersatzwerkzeug an seine Grenzen kommt. Dasselbe gilt analog für Fälle, in denen ein Entwickler oder Business Analyst versucht, die OCR mit Gewalt in einen dokumentenlastigen RPA-Workflow zu integrieren, wenn intelligente Erfassungstools benötigt werden, die auf maschinellem Lernen basieren.
Anders ausgedrückt: Zwischen einem OCR-System und einem intelligenten Erfassungstool liegen Welten. Ein OCR- oder ICR-Tool – intelligente Zeichenerkennung wird häufig zur Erkennung von Handschrift eingesetzt – erkennt Zeichen in einer Abbildung und liefert Text in maschinenlesbarem Format. Einige OCR-Produkte umfassen Tools für die Extraktion von Textmustern oder aus festen Formularen. Doch solche Methoden zur Identifizierung wichtiger Textwerte in einem Dokument sind selten skalierbar oder sind mit einer Vielzahl unterschiedlicher Dokumententypen oft überfordert.
Im selben Bericht von Gartner findet sich folgender Hinweis: „[..] entgegen der Behauptungen einiger RPA-Hersteller gibt es bei der eigentlichen RPA nur begrenzte Einsatzmöglichkeiten für maschinelles Lernen.“ Bei dokumentenlastigen Prozessen reichen Standardtools wie Google, Microsoft, Amazon und ABBYY OCR aber nicht aus, um die Anforderungen an einen Workflow zu erfüllen, der unterschiedliche Dokumente und textliche Wiederholungen beinhaltet.
Bestimmte Eigenschaften der Dokumentenworkflows signalisieren einem Business Analysten oder RPA-Entwickler, dass eher ein intelligentes Erfassungstool eingesetzt werden sollte und kein herkömmliches OCR-System:
- Dies ist der Fall, wenn der Text oder das Layout der verarbeiteten Dokumente variieren. Bei der Bearbeitung von Rechnungen oder Bestellungen reicht OCR allein oder OCR in Verbindung mit vorlagenbasierter Extraktion nicht aus, wenn die Vorlagen unterschiedlich sind.
- Falls Dateien vor der automatisierten Verarbeitung in getrennte Dokumente aufgeteilt werden müssen, wie bei stapelweise eingescannten Dokumenten, wird OCR den Erwartungen nicht gerecht.
- Auch wenn sich wichtige Felder oder Indexfelder wiederholen, wie mehrere Datums- oder Adressangaben in den Vertrags- oder Kreditunterlagen, reicht optische Zeichenerkennung allein nicht aus, um die benötigten Daten korrekt zu extrahieren.
Sie möchten mehr darüber erfahren, wie Sie Ephesoft Transact in führende RPA-Systeme integrieren und die Prozessautomatisierung durch Dokumentenintelligenz erweitern können? Dann klicken Sie hier. Oder senden Sie uns eine E-Mail an info.eu@ephesoft.com oder fordern Sie eine individuelle Demo an.