Die erste OCR Dokumentenextraktion ohne Nachkontrolle

Kollaborationen gibt es zuhauf. Kein Bock auf Miley Cyrus während der Fahrt im Taxi? Dann einfach Uber bestellen und im Fond die eigene Spotify-Playlist geniessen. Oder beim nächsten Stadtbummel garantiert auffallen? Ein Kinderspiel mit den abgefahrenen Yeezys von Kanye West und Nike – nur zwei der zahlreichen Beispiele von Kollaborationen. Die Frage, ob es noch weitere braucht, ist durchaus berechtigt. Die Antwort ist: Eine mag es aber schon noch leiden, zumal diese auch eine etwas andere ist. Nämlich die Kollaboration zwischen Mensch und Maschine, dem sogenannten Human in the Loop (HITL).

Rein manuelle Arbeiten machen niemanden glücklich

Automatisierungen sollen den Menschen im Arbeitsalltag dienen und ihnen manuelle Arbeiten abnehmen. Diese manuellen Arbeiten stehen sehr oft – zu Recht – in der Kritik, zeit-, kostenintensiv und fehleranfällig zu sein. Das zeigt sich beispielsweise bei der Dokumentenverarbeitung ganz spezifisch: Wenn manuell ausgeführt, dann sind diese enorm zeit- und damit kostenintensiv, was gleichzeitig die Chefetage nervös macht und den Mitarbeitern mit mühsamen und langwierigen Arbeiten kaum Mehrwert geben wird. Zusätzlich ist bei langweiligen, sich wiederholenden und damit nur wenig fordernden Arbeiten oft die Fehleranfälligkeit höher, was dann auch niemanden glücklich macht. Doch was und wo genau Automatisierungen vornehmen?

Parashift: Autonome, genaue, schmerzfreie und voll validierte Dokumentenextraktion

Parashift On-Demand-Webinare

Automatisierungen bei der Rechnungsverarbeitung

Wie bei so vielem, ist natürlich auch hier der Kontext wichtig. Der gesamte Workflow in einem Unternehmen muss betrachtet werden, in diesem Beispiel die Dokumentenverarbeitung und spezifisch die Rechnungsverarbeitung mit den üblichen Daten wie:

  • Rechnungsnummer
  • Lieferant
  • Zahlungsdatum
  • Rechnungsbetrag
  • und so weiter

Es braucht demnach Automatisierungen im Bereich des Rechnungseingangs, damit die Rechnungen möglichst gar nicht erst in Berührung mit Mitarbeitern kommen.

Human in the Loop – maschinelle Verarbeitung und menschliche Nachkontrolle

Die Maschine alias die intelligente, KI-basierte OCR

Hier kommt die intelligente, KI-basierte OCR (Optical Character Recognition) zum Zug. Die intelligente, KI-basierte OCR erfasst die eingehenden Rechnungen automatisch, verbessert die Qualität (bei Bedarf inklusive Seitentrennung), klassifiziert die Rechnungen und extrahiert schliesslich alle relevanten Daten daraus automatisch. Was bleibt sind strukturierte Daten, die automatisiert weiterverarbeitet werden können.

Data für die Maschine – Human in the Loop für die Nachkontrolle

Jedes KI-System benötigt Menschen in der Schleife. Zumindest bis zu einem gewissen Grad. Die intelligente OCR ist natürlich nur so intelligent, wie dies die gefütterten Daten zulassen, aus denen die unterschiedlichen Modelle lernen und auf Basis welcher sie ihre Klassifikationen erstellen. Um die Performance der Klassifikationen überhaupt validieren zu können, braucht die KI einen bereits in der Cloud erfassten Datensatz, auf dem basierend sie

a) eine Ground-Truth zur Verfügung hat, um zu wissen, welche Werte korrekt sind beziehungsweise tatsächlich auf einem Dokument stehen

b) fähig ist, Parameter sukzessive so zu wählen, dass Fehler minimiert werden können

c) kontinuierlich die Möglichkeit hat, Parameter neu zu erstellen, um für eine spezifische Metrik optimiert zu werden.

Kann eine Klassifikation nicht vorgenommen oder verbessert werden, beispielsweise aufgrund von fehlenden Datensätzen, braucht die KI zusätzlichen Kontext. Den bekommt sie vom Human in the Loop. Unkorrekte Daten oder Fehler, die zu Kennzeichnungsänderungen führen, können dank dem Human in the Loop schnell erkannt und korrigiert werden. Mit der menschlichen Nachkontrolle kann die Klassifikation validiert und gegebenenfalls anders gekennzeichnet werden, so dass in Zukunft diese Klassifikationen verbessert und wiederum automatisiert und korrekt getroffen werden können.

Der Human in the Loop bestätigt, verweigert oder kennzeichnet bei Bedarf den Output der Maschine

Null Nachbearbeitung seitens der Kunden nötig

Was die intelligente, KI-basierte OCR nicht automatisch erledigt, wird demnach intern durch den Human in the Loop übernommen und voll validiert, damit sich der Kunde zurücklehnen und den Café geniessen kann. Oder sich eben um wesentlich wichtigere Dinge wie Kunden und Handelspartnern kümmern kann.

Massenhaft Vorteile durch Human in the Loop

Die Zusammenarbeit von Maschine und Human in the Loop zur Nachkontrolle bietet also zahlreiche Vorteile:

  • Schnelle Verarbeitung (bei notwendigen Interaktionen ist der Human in the Loop zur Stelle)
  • Hohe Kostenreduktion (zuvor manuelle Arbeiten seitens der Mitarbeiter fallen weg)
  • Keine Dokumenteninteraktion mehr notwendig
  • Erhöhung des Straight Through Processing durch korrekte Daten (Abstimmungen, Verbuchungen, Bestellungen usw.)

Auch wenn sich ‚Mensch in der Schleife‘ auf den ersten Blick schon sehr nach der Maschine Untertan anhört, ist dies (noch) nicht der Fall. Für den erfolgreichen Prozess braucht es die Zusammenarbeit beider.

Related Posts