IDP und OCR: Komplettlösung für die Automatisierung von Dokumentenprozessen

Wer die lange Geschichte der OCR kennt, weiß die umfassenden Möglichkeiten der intelligenten Dokumentenverarbeitung heute zu schätzen. OCR steht für Optical Character Recognition, oder auch optische Zeichenerkennung. Diese ursprünglich als Hilfe für Sehbehinderte gedachte Technologie gibt es bereits seit den 1970ern. Damit lassen sich gedruckte Zeichen interpretieren und in lesbaren Text umwandeln. Während der 1980er und 1990er entdeckten Unternehmen schnell die Vorteile, die das Einscannen und Erkennen von Text mittels OCR bot.

Dokumente ließen sich durchsuchen, die für Abfragen benötigten individuellen Informationen identifizieren und in geschäftliche Systeme extrahieren. Heutzutage steht die OCR weiter oben in der „Nahrungskette“ und versorgt KI-Engines, geschäftsrelevante Workflows und robotische Prozessautomatisierung mit Daten. OCR-Engines der Vergangenheit (und Gegenwart) wie von Recostar oder Nuance, die einst die Branche prägten, wurden inzwischen weiterentwickelt und werden von intelligenten OCR-Diensten wie Google Vision, Amazon Textract und Microsoft Computer Vision in den Schatten gestellt. Diese leistungsstarken cloudbasierten OCR-Dienste sind äußerst genau und liefern erstaunliche Ergebnisse bei automatisch und von Menschen erstelltem Text.

Doch genau hier liegt das Problem. So besonders und genau die Cloud-OCR-Engines auch sein mögen, liefern sie doch stets dieselbe Art von Ergebnis – Rohdaten mit einigen Zusatzinformationen. Die Blackbox liefert noch immer generischen Text, nur mit etwas größerer Genauigkeit. Viele Unternehmen gehen davon aus, dass das alles ist, was sie tun können…

Notwendige Zutaten für Technologie der Enterprise-Klasse

OCR, d. h. die Umwandlung von Bildern in Text, macht nur etwa 10 % der Lösungen für intelligente Dokumentenverarbeitung (IDP) aus. Eine IDP-Lösung der Enterprise-Klasse braucht mehr als nur die Basistechnologie. Vielmehr ist erforderlich, was ich gerne als OCR-“Oreo“ bezeichne, nach den beliebten Keksen. Schließlich besteht der Keks nicht nur aus der Cremefüllung – der OCR –, die sich allein gar nicht verpacken lässt. Vielmehr steckt die Creme zwischen zwei knusprigen Keksen oben und unten – die Schritte vor und nach der OCR. Nur so ist der Oreo-Keks komplett.

Was fehlt also den intelligenten Cloud-OCR-Lösungen? Sehen wir uns die Schritte vor und nach der OCR genauer an. Unser Head Architect der Ephesoft-Plattform hat zusammengestellt, wie Dokumente vorbereitet werden sollten, um ein korrektes OCR-Ergebnis bei der Vor- und Nachbereitung zu erhalten, damit Genauigkeit, Validität und die richtige Bereitstellung möglich sind.

Beispiel für die Schritte vor und nach den OCR-Diensten

 

Die Liste ist zwar generisch, werden granulare Microservices benötigt, um einzelne Teilschritte durchzuführen. Das folgende Beispiel zeigt die Bearbeitung von Rechnungen in der Finanzbuchhaltung und die relevanten Prozesse, um Scans von Rechnungen zu interpretieren.

Vor der OCR Nach der OCR
Import Prognose durch KI
Normalisieren Interpretieren
Dateivorbereitung Tabelle der KI
Generieren der Ressourcen KI des Herstellers
KI für Bildvorbereitung Abgleich Tabelle
Anbieter ERP-Daten
Normalisierung der Daten
Warteschlange
UI (Benutzeroberfläche für Ausnahmen)
Export

Der Zauber liegt in den Schritten vor und nach der OCR und nicht in der OCR selbst. Genau wie beim Oreo-Keks.

Die Alternativen: Make or Buy?

Seit Jahrzehnten stehen CIOs vor dem ewigen Dilemma: Sollen wir die Technologie kaufen oder selbst entwickeln? Im Zeitalter der robotischen Prozessautomatisierung (RPA) und der No-Code-/Low-Code-Plattformen des Jahres 2021, gibt es viele Möglichkeiten, sich zu verzetteln. So werden Anwendungen erstellt, die ineffizient sind, die Erwartungen der Anwender enttäuschen und nichts taugen. Heute sollte sich ein CIO diese zehn Fragen stellen, um mögliche Probleme zu vermeiden:

  1. Welche Ergebnisse werden aus Sicht der OCR oder Datenextraktion erwartet, damit das Unternehmen erfolgreich ist?
  2. Handelt es sich um echt digitale Dokumente oder nur um Kopien von physischen Dokumenten?
  3. Ist mein Team in der Lage, die Teilschritte vor und nach der OCR bzw. Extraktion zu entwickeln und technisch zu unterstützen?
  4. Verfügen meine Mitarbeiter über das Know-how oder die Erfahrung, die Software für die Dokumentenprozesse bzw. die entsprechenden Anwendungen zu schreiben?
  5. Habe ich saubere, korrekte Daten, um ML-Modelle zu entwickeln, um die OCR-Ergebnisse der OCR-Engine XYZ zu interpretieren?
  6. Soll die Organisation wirklich ein Software-/RPA-Haus sein?
  7. Sind 80 % Genauigkeit mit Blick auf den geschäftlichen Nutzen insgesamt erheblich?
  8. Wer wird meine Anwendung aktualisieren und sie auf dem neuesten Stand halten, wenn es kleine Anpassungen an den Dokumenten gibt, die interpretiert, konfiguriert oder verstanden werden müssen?
  9. Wie werde ich die Sicherheit der Anwendung und die OCR-Daten in der Cloud verwalten?
  10. Welches ist der schnellste und kostengünstigste Weg?

Ephesoft ist anders

Diesen Blog habe ich geschrieben, weil wir im Gespräch immer wieder sehr schnell bei der Frage „Make or Buy?“ landen, insbesondere bei größeren Neukunden und Kunden. Meistens gibt es einen internen Berater oder ein Team, das sich meldet und sagt: „Das ist einfach. Wir können das mit RPA und Textract (Google oder ähnlichen Lösungen) entwickeln.“ Lassen Sie sich von Verheißungen der OCR nicht in die Irre führen. Denken Sie vielmehr an den Oreo-Keks – eine starke Grundlage ist für Ihr Projekt der digitalen Transformation nur vorteilhaft.

Aufbauend auf zehn Jahren Erfahrung mit der Entwicklung von Erfassungstechnologie hat Ephesoft die Plattform der nächsten Generation für die intelligente Dokumentenverarbeitung entwickelt: Anhand des Kontexts im Dokument wird dabei die Produktivität gesteigert. Durch die Kombination führender OCR, KI, maschinellem Lernen und Regeln erreichen wir beispiellose Genauigkeit und von Anfang bis Ende reibungslose Dokumentenprozesse. Fordern Sie noch heute eine Live-Demo an und erfahren Sie, wie Sie mit unserer Hilfe die Geschäftsziele erreichen.