„Wir automatisieren Ihre Buchhaltung.“ – Zu Beginn drehte sich bei Parashift alles um die Buchhaltung und damit zu einem Grossteil um die Verarbeitung von Rechnungen. Mit ein paar Machine Learning (ML)-Modellen konnten dabei bereits gute Resultate erzielt werden. Zusätzliche Kundenanforderungen führten schliesslich jedoch zu einem grundsätzlich anderen, innovativen Technologieansatz.
Am Anfang waren die Möglichkeiten der Parashift Plattform andere, als dies heute der Fall ist
Um eine universelle, horizontale Lösung zu haben, die jegliche Art von Dokumenten out-of-the-box handhaben kann, musste eine leistungsstarke Lösung gebaut werden.
Mehr Datenfelder, bitte! Mehr Dokumententypen, bitte!
Zu Beginn wurde die gesamte Engine dabei von drei einzelnen ML-Modellen für die folgenden Vorhersagen angetrieben:
- ML-Modell 1: Die Vorhersage aller Kopfdaten, also von Rechnungs- und Bestellnummer, Rechnungs- und Lieferdatum, sowie Gesamtbetrag
- ML-Modell 2: Die Vorhersage der Einzelpositionen
- ML-Modell 3: Die Vorhersage für den Absender, der die Rechnung gesendet hat
Für einen schnellen Start lieferten die drei ML-Modelle gute Resultate. Die Anforderungen der Kunden an die Lösung von Parashift wurden aber nach und nach umfangreicher, darunter kamen folgende Probleme und Anfragen der Kunden zum Vorschein:
- „Wir müssen zusätzliche Datenfelder extrahieren, wir benötigen ausserdem die Felder X und Y.“
- „Wir müssen diese und jene Referenz auslesen.“
- „Wir wollen weitere spezifische Einzelpositionen extrahieren.“
- „Wir wollen neben Rechnungen weitere Dokumententypen wie Lieferscheine und Bestellungen auslesen.“
- „Wir benötigen die exakten Daten von Dokumententypen wie Lieferscheine und Bestellungen, damit unser Rechnungsprozess funktioniert.“
Das Interesse am Prinzip “jegliche Art von Dokumenten auf eine Cloud-Plattform schmeißen und die Informationen daraus extrahieren” war immens.
Grosse Herausforderung, eine leistungsstarke Lösung zu bauen
Parashift stand vor der grossen Herausforderung, die passende Lösung zu bauen. Das Problem hierbei war, dass bei einem Vorgehen nach dem gleichen Prinzip wie bei den drei ML-Modellen für jeden neuen Dokumententypen so nicht nur drei neue ML-Modelle für alle Vorhersagen hätten erstellt werden müssen. Gleichzeitig hätte auch das Training der Datenfelder bei Null beginnen müssen. Und dies bei jedem neuen Dokumententypen. Der Aufwand wäre so immens und das Unterfangen niemals skalierbar gewesen.
ML-Modelle nicht nach Dokumententyp, sondern nach Datenfeld
Parashift kam auf die Idee, so viele Daten wie möglich gemeinsam und übergreifend zu nutzen (aber natürlich nie die eigentlichen Daten), um die ML-Modelle nicht nach Dokumententyp, sondern vielmehr nach Feldeinheit zu erstellen und zu trainieren. Die Swarm Learning-Technologie war geboren.
Mit dieser bahnbrechenden Methodik kann so beispielsweise ein Rechnungsdatum trainiert und dann in jedem anderen, beliebigen Dokumententyp wiederverwendet werden. Wenn also beispielsweise ein Lieferant einen Brief erhält, indem sich ein Kunde über seine Rechnung beschwert, dann kann einfach das vortrainierte Feld verwendet und die Rechnungsnummer automatisch aus dem Brief ausgelesen werden.
Eine universelle, horizontale Lösung für alle Dokumententypen
Dank Swarm Learning und der leistungsstarken, KI-Technologien dahinter kann schnell mit neuen Dokumententypen begonnen, Dokumententypen können leicht geändert und neue Felder hinzugefügt werden. Ganz simpel und mit wenigen Klicks. Und das eben nicht nur mit Rechnungen wie zu Beginn der Fall, sondern mit jeglicher Art von Dokumenten.