Das Ziel des Gaia-X Förder- und Forschungsprojekts OpenGPT-X: ein großes Sprachmodell mit Modellvarianten, zugeschnitten auf europäische Sprachen und Bedarfe für Business und Verwaltung. Daraus entsteht unter anderem eine KI- Anwendung für die Versicherungsbranche mit überzeugenden Vorteilen. Ein Interview.
Als federführender Datenwissenschaftler beim Konsortialpartner ControlExpert betreuen Sie die Entwicklung des Anwendungsbeispiels Versicherung bei OpenGPT‑X. Um was genau geht es dabei?
Stephen Seiler: Wir sind schon seit vielen Jahren in der Schadensabwicklung für Kfz-Versicherungen tätig und setzen dabei KI ein. Bei unserer Beteiligung am Projekt OpenGPT‑X geht es darum, große Sprachmodelle für die automatisierte Dokumentenanalyse zu trainieren, die beispielsweise Kostenvoranschläge und Gutachten automatisiert bearbeiten. Außerdem entwickeln wir einen digitalen Assistenten, der Versicherungsnehmer aktiv dabei unterstützt, entstandene Unfallschäden aufzunehmen.
Welche Rolle spielt das große Sprachmodell von OpenGPT‑X dabei?
Bei der Analyse der Schadensdokumente übernimmt die KI die Aufgabe, diese inhaltlich einzuordnen, auf Richtigkeit zu prüfen und dann zu entscheiden, ob zusätzlich ein Kfz‑Sachverständiger den Vorgang überprüfen muss. Wenn sich der Kostenvoranschlag im üblichen Rahmen bewegt, kann die KI die Zahlung veranlassen. Sehr komplex sind auch Fälle, bei denen die KI prüfen muss, wer bei einem Schaden zu welchem Prozentsatz haftet. Daran arbeiten wir derzeit noch im Detail.
Die Einführung von ChatGPT hat die KI-Welt revolutioniert. Wie hat sich Ihre Arbeit im Projekt verändert?
Durch die Markteinführung von ChatGPT Ende 2022 und den schnell aufeinander folgenden weiteren großen Sprachmodellen gab es beim Sprachverständnis und den Trainingsmethoden von KI einen gewaltigen Sprung nach vorn. Diese rasante Entwicklung hat uns mit unserem – verglichen mit dem großer Tech-Konzerne – überschaubarem Projektbudget vor große Herausforderungen gestellt. Gleichzeitig brachte dies viel Dynamik in unsere Arbeit und neue, erheblich gesteigerte Automatisierungsmöglichkeiten mit sich.
Das heißt also, es ist sehr herausfordernd für das Sprachmodell von OpenGPT‑X gegenüber diesen riesigen Large Language Models (LLMs) zu bestehen und eine entsprechende Nische zu finden?
Wir probieren die in dem Projekt entwickelten Modelle und Modellvarianten aus und vergleichen sie mit den großen Sprachmodellen auf dem Markt. Dadurch wissen wir heute sehr genau, welche Vorteile OpenGPT‑X gegenüber anderen großen LLMs bietet. Sprachmodelle, die auf OpenGPT‑X basieren, haben zwar weder die Größe noch die Menge an Trainingsdaten wie diese LLMs. Aber die Größe von Sprachmodellen ist längst nicht alles, im Gegenteil. So bietet das OpenGPT‑X Modell Unternehmen gerade durch seine viel kompaktere Größe sehr interessante Vorteile.
Aus diesem Grund können wir beispielsweise dieses Open Source Modell auch bei uns im Unternehmen selbst oder in einer privaten Cloud hosten. Durch den geringeren Programmumfang des Modells und dem Betrieb im Edge bei uns im Data Center erreichen wir eine viel geringere Latenz, das heißt der Zeitverlust durch Datenverarbeitung und -übertragung ist deutlich geringer. Unsere Modellvariante arbeitet somit schneller und liefert seine Ergebnisse etwa in einer Sekunde statt sonst erst in fünf bis zehn. Das macht für uns einen großen Unterschied, denn das erspart eine Menge Wartezeit und beschleunigt unsere Services enorm.
Gibt es weitere Vorteile?
Da das Open GPT-X Modell vermutlich open source sein wird, wissen wir auch, wie es trainiert wurde. Diese weitgehende Transparenz fehlt meist bei den kommerziellen Modellen, weil oft weder ein Blick in die Programmierung noch in die Trainingsmethoden möglich ist. Außerdem wissen wir genau, mit welchen Daten das OpenGPT-X Modell trainiert wurde. Das ist wesentlich für die Verarbeitungsqualität und damit für die Ergebnisse unserer Services. Wir haben also sehr gute Möglichkeiten, die Qualität der Ergebnisse zu kontrollieren. Und da wir auch Updates selbst einspielen, können wir eventuelle Auswirkungen auf die Datenverarbeitung ebenfalls präzise steuern.
Was bedeutet das konkret?
Diese Punkte sind entscheidend für unsere Kunden, sie schaffen Sicherheit und Vertrauen. Hier spielt übrigens auch das Hosting im eigenen Haus eine wichtige Rolle: Wir können dadurch eine sehr hohe Datensicherheit garantieren, denn die Daten werden bei uns vor Ort oder in der privaten Cloud verarbeitet und können nicht von Dritten eingesehen werden.
OpenGPT-X ist multilingual und eignet sich besonders für den europäischen Kontext. Welche Auswirkungen hat das für Ihr Geschäftsmodell?
Schon von Anfang an war das OpenGPT-X Sprachmodell auf Mehrsprachigkeit ausgerichtet. Das ermöglicht uns, Dienstleistungen und Services auf einem sehr hohen sprachlichen Niveau in Deutsch anzubieten und gleichzeitig, ohne erheblichen Mehraufwand, auch für viele europäische Sprachen. So lässt sich unser Chatbot auf Basis von OpenGPT-X beispielsweise recht einfach in vielen weiteren Sprachen auf unseren Service-Webseiten integrieren. Das bedeutet, dass wir unsere Dienstleistungen schnell auf die Gegebenheiten anderer europäischer Länder anpassen und dann dort unsere Services anbieten können.
Wie würden Sie das Sprachmodell von OpenGPT-X in Bezug auf Gaia-X einordnen?
Ich glaube, Vertrauen, Sicherheit und Transparenz, alles Prinzipien von Gaia‑X, sind in diesem Zusammenhang entscheidende Punkte. Denn durch das OpenGPT‑X Sprachmodell erhalten Nutzende einen vertrauensvollen Zugang zu einer sehr flexiblen und effizienten Künstlichen Intelligenz. Diese bietet maximale Transparenz – sowohl in Bezug auf die Datenverwendung und -herkunft, als auch auf die Art des Trainings. Das schafft Sicherheit und Vertrauen im täglichen Umgang mit der KI und bei den Anwendungen für die Kunden.
ControlExpert ist eine Allianztochter und bietet Versicherungen die komplette Dienstleistung von der Schadensabwicklung über die Buchung eines Werkstatttermins bis hin zu Auszahlung an.
Stephen Seiler Dipl. Ing. (FH) arbeitet als Lead Data Scientist bei Control Expert und ist verantwortlich für den Use Case ‚Dokumentenverarbeitung bei der Schadensabwicklung durch Kfz-Versicherungen‘ beim Gaia‑X Förderprojekt OpenGPT‑X.