Im letzten Blogbeitrag behandelten wir kurz die Evolutionsgeschichte sowie die wichtigsten Vor- und Nachteile von Cloud- und On-Premise-Lösungen generell. In diesem Teil der Blogartikel-Serie werden wir nun spezifischer und schauen uns ergänzend diejenigen von Cloud- und On-Premise-Applikationen im OCR Bereich an. In diesem Kontext erläutere ich auch gleich, wie wir bei Parashift die Vorzüge des Cloud-Netzwerks nutzen, um so möglichst kosteneffizient eine globale Plattform zur autonomen Dokumentenverarbeitung bauen zu können. Zu guter Letzt folgt dann noch ein zusammenfassendes Fazit der beiden Beiträgen.
Extraktionsqualität: Die Kostenfalle
Neben den allgemein zu berücksichtigenden Trade-offs, die ich zuvor im Teil 1 beschrieben habe, ist für Software-Lösungen im OCR Bereich insbesondere die Extraktionsqualität ein wichtiger Aspekt, den man bei der Wahl der Infrastruktur gleichermassen bedenken sollte. Heutzutage sollten Sie bei traditionellen On-Premise-Installationen nach der initialen Setup, Konfigurations- und Lernphase zwar im Stande sein, industriespezifische Standardfälle gut abzuarbeiten. Die Extraktion ist aber auf eine bestimmte Anzahl von verschiedenen Dokumenten und Layouts, die Sie gemeinsam mit dem Software-Provider spezifisch im Rahmen des Einführungsprojektes der OCR-Software erarbeitet haben, limitiert.
Damit Sie die Flexibilität der OCR erhöhen oder weitere Qualitätsverbesserungen der Extraktion realisieren können, was zwei signifikant verschiedene Aufgaben sind, sind Sie daher mehr oder weniger permanent auf Consulting und technische Unterstützung seitens des Herstellers angewiesen. Dementsprechend sind solche Unterfangen mit erheblichen Aufwendungen verbunden. Mit zusätzlichen Investments und Konfigurationen sollten Sie jedoch in der Regel dann auch Sonderfälle automatisieren können. Wollen Sie darüber hinaus und wirklich autonome Verarbeitung erreichen, wird dies sehr schnell sehr teuer, da Ihre Grenzkosten in diesem Prozess exponentiell ansteigen.
Wenn Sie stattdessen einen Cloud-OCR-Service nutzen, eröffnen Sie sich die Möglichkeit zum Cost- und Effort-Sharing mit allen anderen Benutzern der Plattform. Konkret heisst das, dass einerseits entstehende Kosten für den Ausbau der zum Verarbeiten unterstützten Dokumente, Layoutvariationen und Sprachen sowie die inkrementellen Extraktionsverbesserungen der OCR durch alle Kunden des Dienstes getragen werden. Andererseits wird aber auch der zu leistende Effort für den einzelnen User extrem minimiert. Denn Sie sind nicht mehr zwangsläufig auf langwierige Projekte angewiesen, um Ihre OCR Technologie weiterzuentwickeln. Vielmehr werden die technologischen Fortschritte bei Cloud-OCR-Services fortlaufend und ohne zusätzliches Beisteuern Ihrerseits durch alle in der Cloud verarbeiteten Dokumente erzielt und unmittelbar mit allen Kunden im Netzwerk geteilt. Wenn also beispielsweise ein Kunde ein Dokumentenformat mit länderspezifischen Codes und Formatstrukturen verarbeiten, die OCR Maschine für das Volltext lesen oder eine der Extraktionsmethoden optimieren will, werden alle anderen Kunden diese Funktionalität ebenfalls sofort nutzen können.
Auf Basis dieser Cloud-Architektur haben wir bei Parashift eine vielfältige Dokumentenintelligenz aggregiert. Diese stellen wir Ihnen von Tag eins an zur Verfügung, was Sie dazu befähigt, über 64 Standard Dokumenttypen ohne jeglichen Bedarf für Templates prozessieren zu können (die hier unterstütze Auswahl an Dokumenttypen bauen wir stetig aus). Eine initiale Projektphase und weiterführende Verbesserungsprojekte werden somit stark limitiert und in einzelnen Fällen sogar komplett obsolet. Durch die zugrundeliegenden Technologien entsteht also ein Reinforcement-Mechanismus. In anderen Worten bedeutet das, dass mit dem grösser werdenden Datenpool an Dokumenten, die Robustheit und die Extraktionsperformance stetig verbessert werden kann. Folge dessen wird der Extraktionsservice im Konkurrenzvergleich zunehmend attraktiver und mehr Kunden werden ihre Dokumente darüber verarbeiten wollen. Und je mehr Kunden ihre Dokumente via Parashift verarbeiten, desto wirtschaftlicher wird die Lösung beziehungsweise die Optimierung der Performance für jeden einzelnen.
Von Anfang an korrekte Daten
Bis ein OCR-System robust genug ist, um jegliche Dokumente sprach- und länderunabhängig autonom und mit einer Extraktionsgenauigkeit von 99.9 Prozent verarbeiten zu können, benötigen wir zielführende und kostengünstige Validierungs- und Annotation-Prozesse, die der OCR-Maschine im Lernprozess helfen und korrekte Daten liefern. Weil wir explizit auf Autonomie hinarbeiten und dazu die entsprechenden Strukturen und Prozesse aufgebaut haben, können wir bereits heute sehr kostengünstig voll validierte Daten offerieren. Als Kunde können Sie so komplett auf die herkömmlichen Prozesse der Dokumentenverarbeitung verzichten und die hier gesparten Ressourcen anderweitig für wertschöpfende Tätigkeiten einsetzen.
Fazit
Wie Sie sehen, haben SaaS-Lösungen gegenüber On-Premise klar überwiegend Vorteile, die objektiv festgehalten werden können (und demnach unseren Bias zu SaaS-Modellen relativiert ????). Die wohl bedeutendsten dieser Vorteile sind einerseits die geringen Anschaffungskosten, was besonders auch für kleine und mittelständige Unternehmungen spannend sein kann, das einfache Setup, die Skalierbarkeit, aber auch die Möglichkeit zum Outsourcen von nicht zwangsläufig notwendigen IT Prozessen rund um die Software. Bei OCR-Software kommt zusätzlich noch ein weiterer wirtschaftlicher Vorteil hinzu, da Dokumenterweiterungen und Verbesserungen der Extraktionsperformance massiv tiefer ausfallen und nicht zwingend in langer Projektarbeit umgesetzt werden müssen, sondern “on the fly” und ohne spezielles Zutun in die Software eingespielt werden können. Bei all diesen Vorteilen ist es dennoch wirklich wichtig festzuhalten, dass wenn Sie die komplette Kontrolle über Ihre Daten behalten oder eine hohe Software Individualisierung wollen, Sie diverse Trade-offs in Kauf nehmen und doch mit einer On-Premise arbeiten sollten.
Wenn Sie es nicht schon haben, testen Sie doch einmal unsere Extraktionslösung für eine Ihrer Rechnungen.
Folgen Sie uns auf LinkedIn, um die neuesten IDP-Nachrichten zu erhalten.