Es ist manchmal schwierig, bei der Flut an neuen Begriffen im Internet den Überblick zu behalten. Das ist auch im Fall von IDP (Intelligent Document Processing) und OCR (Optical Character Recognition) nicht viel anders. Wer sich nicht genauer mit diesen Begriffen beschäftigt, sieht IDP sehr schnell als simple Wiederaufbereitung von OCR. Was aber nicht stimmt. Ein Überblick der Unterschiede zwischen IDP und OCR.
OCR ist der holprige Pfad neben steil abfallendem Gelände, IDP dagegen die sechsspurige Autobahn der Küste entlang
Was OCR ist und was OCR kann (und was nicht)
OCR ist nichts Neues in der Dokumentenerfassung, sondern hat einige fortschrittliche Jahre auf dem Buckel. Herkömmliche OCR wandelt vereinfacht gesagt ein Bild von Text in maschinenlesbaren Text um. Dieser Prozess kann wertvoll für die simple Digitalisierung von simplen Dokumenten sein, lässt darüber hinaus jedoch einiges zu wünschen übrig. Die zwei Hauptprobleme mit traditioneller OCR sind:
a) Herkömmliche OCR basiert auf einem Template, heisst, zu verarbeitende Dokumente müssen auf bestimmte Regeln formatiert sein, sonst kann die OCR nichts mit den Dokumenten anfangen
b) Herkömmliche OCR kann keinen Kontext aus dem Inhalt ziehen, heisst, Interpretationen der Daten und damit automatisierte End-to-End-Prozesse sind nicht möglich
OCR kann in einigen wenigen Fällen die Lösung sein, beispielsweise bei nur einer einzigen regelbasierten Form. Die Realität in Sachen Variation der Dokumente, mit der ein Unternehmen tagtäglich arbeitet, sieht aber deutlich anders aus. Einige grundlegende Punkte für Unternehmen sind mit herkömmlicher OCR nicht zu lösen:
- Sobald semi-strukturierte, unstrukturierte und handschriftliche Dokumente zu verarbeiten sind, ist mit traditioneller OCR Schluss, die Erstellung und Wartung von Templates für sämtliche Formate ist viel zu aufwendig und zu teuer
- Für die grossflächige Implementierung und Skalierung ist die traditionelle OCR dadurch ungeeignet
IDP ist eine Kombination verschiedener intelligenter Technologien
Was IDP ist
Wie zu Beginn erwähnt, ist IDP keine billige Wiederaufbereitung von OCR. Fairerweise muss jedoch gesagt werden, dass die über die Jahre vorangegangenen Fortschritte von OCR IDP erst ermöglicht haben. Oder anders ausgedrückt: Während OCR nichts mit IDP am Hut hat, nutzt IDP OCR weiterhin als Teil einer leistungsstarken Kombination. OCR wandelt ein Bild von Text in lesbaren Text um, den Rest erledigen intelligente und fortschrittliche KI-Technologien, darunter Machine Learning und Deep Learning. Dadurch ist IDP einerseits fähig, kognitive Fähigkeiten nachzuahmen, also Dokumente richtig zu erfassen, richtig zu klassifizieren und alle relevanten Daten daraus zu extrahieren. Zusätzlich können diese relevanten Daten dann auch noch automatisiert in die korrekten Workflows für die weitere Verarbeitung eingespiesen werden.
IDP vermag die grossen Lücken, welche die herkömmliche OCR in der automatisierten Dokumentenerfassung hinterlassen hat, zu schliessen
Was IDP kann
Mit IDP als Kombination aus fortschrittlichen KI-Technologien, welche leistungsstarke OCR, Machine Learning und Deep Learning Technologien verbindet, kann eine enorme Variation an Dokumenten mit grosser Variabilität verarbeitet werden. Die Rede ist von semi-strukturierten, unstrukturierten und komplexen Dokumenten, oft auch mit handgeschriebenem Text, wie sie täglich in Unternehmen sämtlicher Branchen eingehen und verarbeitet werden. IDP erkannt und erfasst nicht nur den Inhalt, sondern zieht vor allem auch den Kontext aus diesem Inhalt heraus. Am Beispiel eines herkömmlichen Bankchecks (die je nach Land durchaus im Umlauf sind) mit grosser Variation ist die Leistungsfähigkeit der KI-Technologien von IDP gut zu erkennen:
- Unstrukturierte Form: Je nach Bank sieht der Check ganz unterschiedlich aus
- Digitaler Text: Von der Bank aufgedruckter Text
- Handgeschriebener Text: Vom Aussteller handgeschriebener Text, z.B. Betrag und an wen ausgestellt
- Betrag in Zahlen: $1000
- Betrag in Text: Eintausend Dollar
IDP lernt mit Machine Learning und Deep Learning Modellen nicht nur laufend dazu, IDP interpretiert dank der fortschrittlichen KI-Technologien den Kontext aus dem Inhalt heraus und weiss also, dass ‚$1000‘ und ‚Eintausend Dollar‘ das Gleiche ist. IDP macht ähnliche Dinge, die zuvor nur vom Menschen ausgeführt werden konnten, einfach besser und vor allem viel effektiver. IDP mahlt durch die Daten wie kein Mensch es je konnte noch können wird, sammelt, analysiert und gibt aus unstrukturierten Dokumenten relevante und strukturierte Daten aus.
IDP bringt Kontext in den Content
Die Vorteile von IDP für Unternehmen
IDP bringt mit der Kombination der intelligenten und fortschrittlichen KI-Technologien massive Vorteile für Unternehmen mit:
- IDP ermöglicht End-to-End-Prozesse von der Erfassung über die Extraktion der Dokumente bis hin in den richtigen Workflow oder zum zuständigen Mitarbeiter
- Mitarbeiter werden von manuellen und mühsamen Arbeiten wie dem Abtippen und Erfassen von Daten erlöst und können sich Aufgaben mit grösserem Mehrwert und direktem Bezug ihrer Fähigkeiten zuwenden
- Fehlerminimierung durch Automatisierung
- Kostenreduzierungen bei gleichzeitiger Erhöhung der Prozessgeschwindigkeiten
- Hohe Flexibilität für die Skalierung
- Bei spezifischen Problemen kommt der Human in the Loop und kann gezielt eingreifen