Das KI-Paradoxon im Banking: Warum hohe Investitionen ohne Performance-Steuerung verpuffen

Mit dem schrittweisen Wirksamwerden des EU AI Act ab August 2026 verschiebt sich der Maßstab weg vom Nachweis von Aktivität hin zu belastbarer Governance und dokumentiertem Wirkungsnachweis. Compliance wird sich somit künftig weniger an der Zahl initiierter Vorhaben bemessen als an deren tatsächlicher Wirkung. Ökonomische und regulatorische Logik rücken damit enger zusammen, als die bisherige Diskussion erkennen lässt.

Für Vorstand und Aufsichtsrat bedeutet das einen klaren Perspektivwechsel: KI gehört nicht mehr an den Rand des Kerngeschäfts, sondern ins Zentrum der Performance-Steuerung. Entscheidend sind hierbei vier Hebel.

Erstens: Steuerungsgrößen müssen sich konsequent an wirtschaftlicher Wirkung orientieren und nicht an bloßer Adoption.
Zweitens: Das Operating Model muss aktiv weiterentwickelt werden – inklusive Rollen, Verantwortlichkeiten und Entscheidungswegen.
Drittens: Programm-Governance braucht die Disziplin, Initiativen ohne messbaren Beitrag konsequent zu beenden.
Und viertens: Auf C-Level ist eine klare Gesamtverantwortung erforderlich, die Prioritäten durchsetzt und Ressourceneinsatz stringent steuert.

Denn der Unterschied zwischen wertschaffenden und wertvernichtenden Programmen entscheidet sich weniger an einzelnen Technologie- oder Talententscheidungen als an der Geschlossenheit, mit der diese Elemente zu einem konsistenten Steuerungsbild zusammengeführt werden. Wo das gelingt, wird KI im Banking zu einem dauerhaften Performance-Hebel. Wo es ausbleibt, bleibt sie eine teure Option auf eine Zukunft, die ohne diesen Schritt nicht eintreten wird.

Status Quo: Aktivität ohne Wirkung

Global bewegen sich die branchenübergreifenden KI‑Ausgaben inzwischen im dreistelligen Milliarden‑ bis niedrigen Billionenbereich, im Finanzsektor mit zweistelligem jährlichen Wachstum. Der dokumentierte Wertbeitrag bleibt bis dato jedoch marginal. Eine breit zitierte MIT-Erhebung aus 2025 weist ebenso auf dieses Muster hin: hohe Aktivität, geringe wirtschaftliche Wirkung.

Unsere Beobachtungen in Banken und Industrie bestätigen das Bild: In nahezu jedem unterperformenden Programm treten dieselben Muster auf. Use Cases, die interessant statt impactful sind und nicht an Konzernprioritäten gebunden werden, fehlendes C-Level-Ownership und funktionale Silos, schwache Daten- und Integrationsfundamente sowie unzureichende Vertrauens- und Risikosteuerung. Im Ergebnis akkumuliert sich ein Portfolio, dessen Wertbeitrag in den Steuerungsgrößen der Bank nicht abzulesen ist. Verstärkt wird das durch eine systematisch unterschätzte Adoptionshürde: Halluzinationen sind kein Bug, sondern eine systemimmanente Eigenschaft generativer Modelle. Für regulierte Funktionen bedeutet das, dass jeder produktive Use Case eine Validierungs- und Eskalationsschicht braucht und damit genau jene Rollen, die durch KI vermeintlich freigesetzt werden sollten. Cost-Out-Rechnungen ohne diesen Gegenposten überzeichnen den Effekt und beschädigen die Glaubwürdigkeit gegenüber Risiko, Audit und Aufsicht.

Drei Fragen, die der Aufsichtsrat stellen sollte

Der Reifegrad eines KI-Programms lässt sich an drei Fragen verlässlich ablesen. Sie zielen auf Ergebniswirkung, strukturelle Veränderung und Portfoliodisziplin und somit die drei Größen, die tatsächlich einen Wertbeitrag leisten.

Welcher EBIT-Effekt ist für das laufende und das kommende Geschäftsjahr eingebucht, und wer verantwortet die Lieferung? Erst eine in der Planung verankerte und mit Verantwortung hinterlegte Wertzusage zwingt zur belastbaren Auseinandersetzung mit Funktionen, Hebeln und Realisierungspfaden.
Welche Funktionen, Rollen und Führungsspannen wurden seit Programmstart strukturell verändert? Der Wertbeitrag aus KI stellt sich nicht über Tools ein, sondern über veränderte Arbeitsweisen und Strukturen. Eine unveränderte Aufbauorganisation ist der zuverlässigste Indikator für ausbleibende Wirkung.
Welche Use Cases wurden in den letzten zwölf Monaten beendet? Wer keinen einzigen Use Case gestoppt hat, verfügt nicht über einen belastbaren Stop-Mechanismus und damit nicht über eine vollständige Portfoliosteuerung.

Bleiben diese Fragen offen, ist das Vorhaben de facto ein Innovationsbudget mit entsprechenden Konsequenzen für Reporting, Budgetierung und die Erwartung an den Ergebnisbeitrag.

Der Hebel: Operating Model statt Tool-Rollout

KI entfaltet ihren Effekt dort, wo Wissensarbeit standardisierbar ist, z.B. bei Operations, Compliance, Reporting, Tier-1-Kundeninteraktion oder Legacy-Code-Modernisierung. In transformationsreifen Banken beobachten wir realistische Zielkorridore von 20-35 Prozent Produktivitätsgewinn in den betroffenen Funktionen, 30-50 Prozent SG&A-Reduktion über zwei bis drei Jahre und eine spürbare Verkürzung der Time-to-Resolution in regulatorisch geprägten Prozessen – stets abhängig von Ausgangsproduktivität, Datenreife und Eingriffstiefe im Operating Model. Diese Größenordnungen werden aber nur dann erreicht, wenn KI Rollen, Spans und Entscheidungswege verändert, nicht nur Tools bereitstellt. In den Programmen, die wir mit konsequenter Operationalisierung begleitet haben, verschieben sich Management-Spans um 30-50 Prozent nach oben, Reviews verkürzen sich um Tage, und in Funktionen wie Reporting, Erstanalyse und Standardkommunikation entfallen ganze Rollenprofile. Kurzum: Wer das Operating Model nicht mitbewegt, finanziert Modelle ohne Hebel.

Was tun mit unterperformenden Programmen?

Unterperformende Programme lassen sich nicht durch mehr Modelle, mehr Daten oder mehr Lizenzen retten. Sie brauchen ein Reset entlang von fünf Schritten:

Radikale Repriorisierung des Portfolios auf wenige werttreibende Initiativen
KPI-Reset auf Outcome-Metriken
Value Tracking mit Cash- und EBIT-Bezug mit klarer Verwantwortlichkeit im Board
Aufbau einer harten Transformation-Control-Tower-Struktur
Neuverankerung auf C-Level-Ebene mit voller Entscheidungs- und Stop-Hoheit.

In den Recovery-Programmen, die wir bei AlixPartners begleitet haben, reduziert sich das aktive Portfolio typischerweise um 40-60 Prozent, während der dokumentierte Wertbeitrag sich vervielfacht.

Im Ergebnis gibt es oftmals nicht mehr KI, sondern weniger. Aber das, was bleibt, hat einen Business Case.

Wenn Sie mehr über unsere Arbeit erfahren wollen, wenden Sie sich gern an die Autoren Stefan Duderstadt, Christoph Winter, Stefan Albust und Max Weltersbach.

Authors

People

Stefan Duderstadt

Partner & Managing Director

Munich

Christoph Winter

Munich

Stefan Albust

Munich

Stefan Duderstadt

Partner & Managing Director

Munich

Christoph Winter

Munich

Stefan Albust

Munich