Für den EQS AI Benchmark Report wurden sechs große Sprachmodelle – OpenAI GPT-5, GPT-4o und o3, Google Gemini 2.5 Pro, Anthropic Claude Opus 4.1 sowie Mistral Large 2 – in 120 Aufgaben aus zehn Kernbereichen der Compliance getestet. Zu diesen Aufgaben zählten unter anderem Risikoanalysen, die Auswertung von Whistleblowing-Meldungen, die Evaluation von Trainings, Richtlinienanalysen und regulatorische Gap-Analysen. […]
Künstliche Intelligenz hält zunehmend Einzug in Unternehmensprozesse – doch nicht alle Modelle liefern gleich gute Ergebnisse. Um zu bewerten, ob KI den Anforderungen in der Compliance-Praxis gewachsen ist, hat die EQS Group gemeinsam mit dem Berufsverband der Compliance Manager e.V. (BCM) sechs führende Modelle in 120 praxisnahen Anwendungsszenarien getestet – von Risikoanalysen und der Bewertung von Interessenkonflikten bis hin zu Third-Party-Screenings. Das Ergebnis: Für strukturierte Aufgaben wie Klassifizierung oder Entscheidungsfindung liefert KI Ergebnisse mit sehr hoher Genauigkeit von über 95 Prozent. Bei komplexeren oder mehrdeutigen Aufgabenstellungen sinkt die Präzision jedoch deutlich. Außerdem macht der Benchmark deutlich, wie rasant sich die Technologie entwickelt: KI-Modelle aus 2025 schneiden signifikant besser ab als solche aus dem Jahr zuvor.
„Für viele Compliance-Verantwortliche ist KI noch weitgehend unbekanntes Terrain“, sagt Moritz Homann, Director Product Innovation und AI bei der EQS Group. „Zu verstehen, wie man KI sinnvoll einsetzt und wo man ihr vertrauen kann, ist nicht einfach – vor allem in einem so sensiblen Bereich wie Compliance, in dem Genauigkeit, Integrität und Rechenschaftspflicht nicht verhandelbar sind.“
„KI kann den Compliance-Beruf auf ein neues Niveau heben. Unsere Verantwortung liegt darin, ihre Anwendung klaren ethischen und rechtlichen Standards zu unterwerfen“, sagt Dr. Gisa Ortwein, Präsidentin des BCM. „Studien wie diese helfen uns, den KI-Hype von…








