Künstliche Intelligenz (KI) ist als Thema in der Wissenschaft und in verschiedenen Industriezweigen von enormer Bedeutung, seitdem Computer in den 1950er-Jahren begannen, unseren Umgang mit Daten zu verändern. Heute kommt KI in nahezu allen Branchen zum Einsatz und bildet das Rückgrat von vielen digitalen Technologien. Damit kommen wir zur Frage, die wir in diesem Blog diskutieren möchten: Was genau ist KI und weshalb ist sie für intelligente Dokumentenverarbeitung so wichtig?

KI und ML

Wenn KI diskutiert wird, fällt im selben Atemzug häufig der Begriff Machine Learning (ML) oder auch maschinelles Lernen. Wer mit dem Fachgebiet nicht vertraut ist, fragt sich möglicherweise, welcher Fachbegriff in welchem Kontext der richtige ist. Einfach ausgedrückt, ist ML eine bestimmte Art von KI, die wahrscheinlichkeitstheoretische Ansätzen und statistische Methoden verwendet. Maschinenlernalgorithmen erstellen ein Modell, das auf einer Stichprobe von Daten basiert, die man auch als Trainingsdaten bezeichnet. Damit treffen die Algorithmen Vorhersagen oder Entscheidungen, ohne dafür speziell programmiert worden zu sein. Daher ist ML ein Zweig oder ein Untergebiet der KI. Da prädiktive Anwendungen auf so vielen Algorithmen und Modellen basieren, denen ML-Methoden zugrunde liegen, meinen viele Menschen eigentlich ML, wenn sie den Begriff KI verwenden.

Klassisches Maschinenlernen vs. Deep Learning

Nachdem wir diese feine Unterscheidung geklärt haben, wenden wir uns nun dem maschinellen Lernen zu, wie es heute angewendet wird. In der Industrie werden derzeit hauptsächlich zwei Technologien eingesetzt, um prädiktive Fragestellungen zu lösen: klassisches Maschinenlernen und Deep Learning. Die klassischen Methoden des maschinellen Lernens gibt es schon seit Jahrzehnten, sogar bevor es Computer gab. Vielleicht kennen Sie einige der Fachbegriffe wie logistische Regression, Support Vector Machines, K-Means-Clustering oder Random Forests, um nur ein paar zu nennen. Diese Algorithmen waren über viele Jahre die Grundlage zahlreicher erfolgreicher Produkte. Viele davon finden sich noch immer in Produktivumgebungen, da sie nach wie vor leistungsstarke Prognosen für viele Anwendungsfälle liefern.

Der zweite bereits erwähnte Ansatz ist das Deep Learning. Dieser hat prädiktive Systeme, die mit Bildern, Ton und Sprache verknüpft sind, tiefgreifend verändert. Deep Learning basiert auf einem Lernsystem, das als neuronale Netze bezeichnet wird. Neuronale Netze spiegeln das Verhalten des menschlichen Hirns wider und ermöglichen es Computerprogrammen, Muster zu erkennen und gängige Fragestellungen zu lösen. Es gibt viele Arten von neuronalen Netzen, sogenannte Architekturen, je nach Aufgabe. Die gebräuchlichste Architektur ist das Convolutional Neural Network (CNN oder ConvNet), zu Deutsch etwa „faltendes neuronales Netzwerk“. Es eignet sich hervorragend für die Vorhersage zu Bildern und Transformern. Letztere sind Architekturen, die auf einem Aufmerksamkeitsmechanismus basieren und in der Regel bei der Verarbeitung natürlicher Sprache eingesetzt werden. Doch seit Kurzem setzt man sie auch erfolgreich bei der Bildverarbeitung ein. Obwohl sich die Forschung seit Jahrzehnten mit neuronalen Netzen befasst, werden diese erst seit 2012 aktiv angewendet, als es beim Software-Wettbewerb ImageNet einen ersten Durchbruch gab. Der Wettbewerb war als Benchmark dafür gedacht, wie gut die getesteten Modelle die Gegenstände auf Bildern erkannten. In jenem Jahr erreichten CNNs bei der Bilderkennung mit großem Abstand die beste Performance. Dies löste einen wahren Boom bei der Erforschung und Entwicklung neuer Technologien für neuronale Netze aus.

KI und ML bei der IDP

Sehen wir uns vor dem oben beschriebenen Hintergrund nun an, welche Rolle KI und ML in der intelligenden Dokumentenverarbeitung (IDP) spielen. Die traditionelle Abwicklung von Dokumentenprozessen ist mit wiederkehrender, reproduzierbarer Arbeit verbunden, die von Aufgabe zu Aufgaben nur minimal variiert. Solche Fragestellungen lassen sich mit maschinellem Lernen ausgezeichnet lösen. Gibt es offensichtliche Muster wie Sprache oder visuelle Hinweise, die ein Mensch identifizieren kann, um ein Dokument zu bearbeiten? In solchen Fällen lässt sich diese Aufgabe mit maschinellem Lernen beschleunigen oder sogar automatisieren. In einer Welt, in der die Informationsströme täglich wachsen, kann eine IDP-Plattform Hunderte oder gar Tausende an Arbeitsstunden einsparen und die Datengenauigkeit verbessern, sodass wertvolle Ressourcen freigesetzt werden.

Ephesoft verwendet für die IDP-Plattform KI-Technologien, damit Kunden Effizienz, Produktivität und Genauigkeit steigern können. Dadurch sind Menschen und Unternehmen in der Lage, schneller zu agieren und zu reagieren. Anwender sparen dadurch 95 Prozent der Zeit, die bisher für die Extraktion und Verarbeitung der Daten in den Dokumenten erforderlich war. Mithilfe von KI und ML hat der Wahnsinn nun Methode – und diese Methode ist der Schlüssel zu intelligenterem und schnellerem Arbeiten.