Hallo Jakub, wir würden gerne mehr über dich erfahren, da du ja erst vor kurzem dem Parashift Team beigetreten bist. Könntest du uns zunächst kurz erzählen, wer du bist?
Hallo, ich bin Jakub und komme ursprünglich aus Polen, aber in den letzten 8 Jahren habe ich in ganz Europa gelebt – technisch gesehen ist die Schweiz mein siebtes Land. Auf dem Weg dahin habe ich an verschiedenen Orten gearbeitet, von kleinen und mittelgrossen Startups bis hin zu ganz grossen Unternehmen. Wahrscheinlich kannst du dir denken, was mir mehr zusagt. Ich liebe es, an herausfordernden Problemen zu arbeiten, aber auch zu sehen, wie meine Arbeit in ein Produkt einfliesst, das jeden Tag Tausende von Menschen beeinflusst.
Sehr cool! Als jemand, der für kleine Startups, aber auch für grosse Unternehmen und in verschiedenen Ländern gearbeitet hat… Musst du einiges an Erfahrung haben! Grossartig! Was ist deine Rolle bei Parashift?
Ich arbeite als Machine Learning Engineer und meine täglichen Aufgaben drehen sich um die Verbesserung der Modelle – dazu gehören Dokumentenklassifizierung, Informationsextraktion oder Dinge wie die neueste Funktion, die wir eingeführt haben – eine verbesserte Dokumentenverbessereung, die wie der Name schon sagt, versucht, die Qualität des Scans/Bildes zu verbessern.
Da wir an einem neuartigen Problem arbeiten, besteht meine Arbeit aus vielen Experimenten, aber auch aus dem Hinterfragen von Ideen und Vorgehensweisen, die wir derzeit anwenden.
Wie bist du zu KI und Machine Learning gekommen?
Es begann alles mit meinem Bachelor-Abschluss. Damals, im Jahr 2013, war der Bereich Machine Learning noch nicht annähernd so populär wie heute, aber ich wagte einen Vertrauensvorschuss und absolvierte einen Bachelor in Knowledge Engineering, einer Kombination aus angewandter Mathematik, Informatik und Grundlagen des Machine Learnings. Das Lustige ist, dass ich eigentlich einen Abschluss in Data Science und nicht Knowledge Engineering gemacht habe. Der Abschluss wurde nämlich in der Zwischenzeit umbenannt, da sich der Begriff nie durchgesetzt hat und die Leute einfach nicht wussten, was “Knowledge Engineering” ist.
Wirklich lustig! Ich habe tatsächlich noch nie von diesem Begriff gehört. Aber jetzt… Mal Hand aufs Herz: Wie hoch ist die Genauigkeit unseres KI-Systems, das mit Deep Learning betrieben wird?
Ich denke, dass diese Frage die meisten ML-Praktiker aus drei Gründen triggern wird. In der Praxis verwenden wir nämlich selten die Genauigkeit als Leistungsmassstab – meistens ist sie kein geeignetes Mittel, um zu messen, wie gut das Modell ist, obwohl viele Aussenstehende dies erwarten. Auch der Begriff KI wird von den Experten nicht wirklich verwendet. Wir arbeiten an maschinellen Lernmodellen, die es in vielen verschiedenen Varianten gibt. Für uns ist KI eher ein Modewort. Schliesslich gehören nicht alle Modelle, mit denen wir arbeiten, zur Familie des Deep Learnings. Es gibt viele Aufgaben, bei denen dies kein geeigneter Ansatz ist – einfach ein Overkill für das Problem.
Hier ist ein Diagramm, das den Unterschied verdeutlicht.
Danke fürs Teilen. Ich denke, das macht die Dinge viel verständlicher. Zumindest für mich. Nun, lass uns fortfahren. Welche zwei Herausforderungen im Bereich der KI faszinieren dich am meisten?
Ich bin sehr begeistert von dem Computer-Vision-Ansatz, den Tesla für seine autonomen Funktionen verwendet. Ja, ja, das ist ein Superhype-Thema, aber was ich besonders interessant finde, ist, dass Tesla sich nicht auf Lidars verlässt, die die Tiefendimension (im Grunde die Entfernung zu den Objekten), sondern stattdessen Standardkameras verwendet und mit Hilfe von Machine Learning diese Informationen schätzt. Das ist ein grosser Unterschied zu Mitbewerbern und ist eine Art Vorzeigebeispiel dafür, wozu ML-Algorithmen in der Lage sind. Wirklich cooles Zeug.
Das andere sind generative Modelle, d. h. Modelle, die in der Lage sind, Bilder, Videos oder andere Arten von Daten zu synthetisieren. Das Trainieren solcher Modelle ist im Allgemeinen schwierig und birgt viele Herausforderungen, so dass ich es umso mehr zu schätzen weiss, wenn ich weiss, wie es unter der Haube funktioniert. Ich denke, wir alle sollten die Entwicklung in diesem Bereich im Auge behalten, da sie unser Leben in naher Zukunft sicherlich beeinflussen wird.
Apropos Zukunft: Was sind deine Erwartungen an die Zukunft von Parashift?
Ich unterschreibe absolut mit beiden Händen unter der Mission und dem langfristigen Ziel, das Parashift sich gesetzt hat. Ich glaube wirklich, dass wir hier etwas Grossartiges auf die Beine stellen. Auch wenn ich noch nicht lange hier bin, kann ich schon viele Verbesserungen am Produkt erkennen und sehe, wie die Schmerzpunkte unserer Kunden gelöst werden. Stell dir vor, was mit der Zeit möglich sein wird, wenn wir das Team vergrössern ????.
Gut zu wissen! Lass uns nun zu einer letzten Frage kommen. Was verstehst du unter allgemeiner Intelligenz, und wie eng hängt deiner Meinung nach das Problem der allgemeinen Intelligenz und der Dokumentenerfassung zusammen?
Allgemeine Intelligenz bedeutet, in der Lage zu sein, eine möglicherweise unbekannte Umgebung wahrzunehmen und dennoch die erwartete Aufgabe zu erfüllen. Im Grunde genommen bedeutet es für mich, dass man in der Lage ist, die Umgebung zu verstehen und auf sinnvolle Weise mit ihr zu interagieren.
Wenn es um die Erfassung von Dokumenten geht, brauchen wir nicht wirklich etwas, das die Umgebung wahrnehmen und mit ihr interagieren kann (zumindest im Moment), sondern vielmehr etwas, das Kenntnisse über alle Arten von Dokumenten und Dateien hat. Ich sehe dies als eine der Fähigkeiten an, die eine Maschine mit allgemeiner Intelligenz besitzen sollte.
Interessant. Danke, dass du deine Perspektive geteilt hast. Und danke, dass du dir heute die Zeit genommen hast. Wir sind alle froh, dich an Bord zu haben!