Big Data – Die Verheißung unstrukturierter Daten für das Finanzwesen Rede auf der Veranstaltung „BaFinTech 2023“ der Bundesanstalt für Finanzdienstleistungsaufsicht

Es gilt das gesprochene Wort.

1 Einleitung

Sehr geehrte Frau Roth,
meine Damen und Herren!

Der Zukunftsforscher und Autor John Naisbitt prägte folgenden bemerkenswerten Satz: Wir ertrinken in Informationen, aber hungern nach Wissen. Wenn wir dieses Bild weiterverfolgen, dann können wir uns die heutige Informationswelt als einen gewaltigen Ozean an Informationen vorstellen, gespeist durch Daten von sozialen Medien über Wetterdaten bis hin zu Finanztransaktionen.

An seiner Oberfläche sehen wir die strukturierten Daten, gleich den klaren, gut sichtbaren Wellen. Sie sind in der Regel geordnet, regelmäßig und leicht zu erfassen. Doch unter dieser Oberfläche, in den tieferen und weniger erkundeten Schichten, verbirgt sich ein weites Feld, in großen Teilen unerforschtes Terrain – die unstrukturierten Daten. Diese Tiefen sind geheimnisvoll, undurchsichtig und voller Rätsel, die darauf warten, entschlüsselt zu werden, auch wenn sie oft schwer zugänglich sind.

Etwa 80% der von Unternehmen gesammelten Daten sind unstrukturiert und diese Menge belief sich 2022 auf beachtliche 82 Zettabyte weltweit. Das ist eine Zahl mit 21 Nullen! Zum Vergleich: Wenn jedes Byte ein Tropfen Wasser wäre, könnte man damit einen Ozean befüllen, der 13 Mal so groß wie der Atlantik wäre! Und dieser Datenozean wächst: Für 2027 prognostizieren Experten etwa 228 Zettabyte an unstrukturierten Daten.

Doch welchen Nutzen können die Akteure des Finanzsystems aus dieser Flut an unstrukturierten Daten ziehen? Ähnlich wie ein erfahrener Fischer, der mit seinem Netz in den Tiefen des Ozeans nach Fischen sucht, können Unternehmen durch gezielte Analyse dieser Datenströme mit Hilfe von Künstlicher Intelligenz (KI) und maschinellem Lernen wichtige Erkenntnisse für Prognosen, Risikobewertungen und Entscheidungen gewinnen. Das ist die Verheißung unstrukturierter Daten, die insbesondere für das Finanzwesen von Bedeutung sind – das Thema der heutigen Rede. 

Wir als Bundesbank nutzen selbst unstrukturierte Daten und ermutigen die Banken, sie zu nutzen. Denn durch die Analyse dieser Daten können alle Akteure an den Finanzmärkten zu intelligenteren Ergebnissen und besseren Entscheidungen kommen. Und damit können unstrukturierte Daten auch zur Verbesserung der Finanzstabilität beitragen.

Bei den folgenden Überlegungen stehen drei Fragen im Fokus: 

  1. Was sind die starken Treiber für die Nutzung von Big Data in der Finanzindustrie?
  2. Wie nutzt der Finanzsektor insgesamt und insbesondere die Bundesbank unstrukturierte Daten?
  3. Wie verändern unstrukturierte Daten das Finanzsystem und den Wettbewerb? 

2 Was sind die starken Treiber für die Nutzung von Big Data in der Finanzindustrie?

Als Institutionen der Finanzstabilität haben BaFin und Bundesbank nicht nur die Verantwortung, den Finanzsektor zu überwachen, sondern auch, die Entwicklungen und Herausforderungen der modernen Datenlandschaft zu verstehen.

Big Data ist heute ein omnipräsenter Begriff, der im Wesentlichen den rasanten Anstieg und die Vielfalt von Daten umfasst, die für herkömmliche Analysemethoden oft zu umfangreich sind. Diese Datenwelt ist durch drei Hauptelemente geprägt.

Erstens: Die explosionsartige Zunahme der Daten. Das Volumen der jährlich generierten oder replizierten digitalen Datenmenge weltweit ist allein zwischen 2010 und 2022 um das 51-fache gestiegen.

Zweitens: Innovative Speichertechnologien wie Cloud-Dienste, die die schnelle Verarbeitung dieser enormen Datenmengen erlauben. 

Drittens: Fortschritte in Algorithmen und Künstlicher Intelligenz, die die Analyse sehr komplexer Daten ermöglichen. 

Ein weiterer bedeutender Aspekt dieses Datenzeitalters ist der Wandel von aggregierten Informationen hin zu granularen, detaillierten Daten. 

Aber nicht alle Daten sind gleich. Einige sind klar strukturiert, wie die präzisen und systematischen Börsenkurse. Andere sind weniger klar definiert, wie Finanzberichte, die sowohl Tabellen als auch ausführliche Textabschnitte enthalten, wodurch sie als semi-strukturiert gelten. Und dann gibt es unstrukturierte Daten, die weder klar geordnet noch klar definiert sind. Denken Sie an Multimedia-Inhalte wie Podcasts, Videos, Audiodateien, Textnachrichten und E-Mails. Diese Arten von Daten sind unstrukturiert und können oft nicht ohne weiteres in traditionelle Datenbanksysteme eingepflegt werden.

Insbesondere für die Bundesbank stellt der Übergang von den strukturierten Daten, mit denen wir jahrzehntelang gearbeitet haben, zu den großen, unstrukturierten Datenmengen einen großen Schritt dar. Als "Bank der Banken" tragen wir dabei eine erhebliche Verantwortung. 

Unstrukturierte Daten sind somit sowohl eine Herausforderung als auch eine großartige Chance für uns. Diese Daten können wertvolle Einsichten liefern, die es uns ermöglichen, unsere Aufgaben, von der Geldpolitik über die Bankenaufsicht bis hin zur Finanzstabilität, noch effektiver zu erfüllen. 

Aber wie nutzen die Bundesbank und der Finanzsektor diese unstrukturierten Daten konkret?

3 Wie nutzt der Finanzsektor insgesamt und insbesondere die Bundesbank unstrukturierte Daten?

In der Bundesbank und im Finanzsektor gibt es zahlreiche Anwendungen, die unstrukturierte Daten analysieren. Ihre Menge und Komplexität machen KI und maschinelles Lernen unverzichtbar.

Denken Sie an die Entwicklung der letzten Jahre: Die Analyse mittels KI hat sich von der Kundenschnittstelle, dem Front-End, bis in den Kern der Banken, den Maschinenraum, bewegt.

Wenn wir uns das Front-End ansehen, dann sind es vor allem kunden- und produktorientierte Anwendungen, die im Rampenlicht stehen. Denken Sie zum Beispiel an Chatbots, die Kundenanfragen in Echtzeit bearbeiten und dabei sogar Cross-Selling von zusätzlichen Dienstleistungen übernehmen.

Im Back-End dominieren analytische sowie prozess- und risikoorientierte Anwendungen. Besonders im Bereich Kreditwürdigkeitsprüfung, Betrugserkennung und Risikomanagement spielen sie eine Rolle. 

Und um Ihnen ein noch klareres Bild zu geben, möchte ich Ihnen entlang dieses Trends einige konkrete Beispiele aus der Bundesbank und aus der Finanzwirtschaft vorstellen.

Hier unser erster analytischer Anwendungsfall aus dem Inneren der Bundesbank berichten. Stellen Sie sich ein System vor, das täglich Tausende von Nachrichtenartikeln durchforstet, die meisten mit wirtschaftlichem oder politischem Bezug. Dieses System, das wir "BUBA-Bot" nennen, stammt aus unserem Zentralbereich Märkte und nutzt neuronale Netze und Webscraping, um wertvolle Marktinformationen zu liefern.

Das Tool ist schon seit einigen Jahren in Betrieb. Es durchsucht Webseiten und lädt Nachrichtenartikel herunter. Durch Sentimentanalysen, einem Prozess zur Ermittlung der Meinung, des Urteils oder der Emotion hinter einer Aussage, werden diese Artikel bewertet und mittels KI thematisch klassifiziert. Die Daten kombinieren wir anschließend mit Finanzmarktdaten und werden für Fragestellungen, die im Bereich „Market Intelligence“ und Marktanalyse relevant sind, nutzbar gemacht.

Und hier kommt der spannendste Teil: Der BUBA-Bot integriert aktuell eine ChatGPT KI. Dies ermöglicht es den Nutzern, mit der KI über aktuelle weltweite Entwicklungen zu diskutieren und Einschätzungen der KI zur Nachrichtenlage zu erhalten. 

Schließlich möchte ich Ihnen noch ein weiteres, äußerst interessantes Beispiel für prozessorientierte Anwendungen aus unserem Hause präsentieren, den Prototypen "Medienanalyse" aus dem Zentralbereich Bankenaufsicht. Dieses Werkzeug dient uns zur Analyse unstrukturierter Daten, speziell in der Bankenaufsicht. Stellen Sie sich vor, wir können mittels modernster maschineller Textanalyse aus einer Flut tagesaktueller Informationen – seien es Nachrichten, Unternehmensmitteilungen, Artikel in Fachzeitschriften, Lokalzeitungen oder sogar Handelsregistereintragungen – Entwicklungen von Bankrisiken und aufkommende Trendthemen identifizieren.

Mit Hilfe von gezielten Stichwörtern können wir einzelnen Dokumenten verschiedene Risiken zuordnen, übergeordnete Themen herausfiltern und sogar feststellen, welche Finanzinstitute in dem jeweiligen Dokument Erwähnung finden.

Meine Damen und Herren, obwohl wir in der Bundesbank bereits Fortschritte erzielt haben, stehen wir noch am Anfang eines spannenden Weges. Zahlreiche vielversprechende Möglichkeiten prägen bereits unseren Arbeitsalltag und werden dies auch in Zukunft tun. Wir sind zwar bereits unter die Wasseroberfläche des Datenozeans vorgedrungen, aber bis hin zum Meeresgrund ist es noch ein weiter Weg.

Lassen Sie uns nun einen Blick auf die faszinierende Welt der Finanzwirtschaft werfen, in der die Analyse unstrukturierter Daten bereits Fuß gefasst hat. 

Nehmen wir als konkretes risikoorientiertes Anwendungsbeispiel die Geldwäschebekämpfung. Stellen Sie sich vor, KI-Systeme könnten nicht nur eine Vielzahl von Transaktionen wie Aus- und Inlandszahlungen, Wertpapiertransaktionen und Kreditanträge durchsuchen, sondern auch unstrukturierte Daten wie Audio- und Videoaufzeichnungen sowie Geodaten erfassen. Durch den Abgleich dieser Informationen mit anderen verfügbaren internen und externen Datenquellen können Auffälligkeiten und Anomalien erkannt werden. In diesem Kontext wird die Technologie besonders effektiv, wenn relevante Daten mehrerer Organisationen zusammengeführt werden, wie es bei der gemeinsamen Nutzung von Daten durch über 2000 Finanzbanken in den USA der Fall ist. Diese kollektive Verwendung ermöglicht eine noch effektivere Aufspürung von Geldwäsche.

Lassen Sie mich noch ein weiteres Beispiel nennen: Denken Sie an die Möglichkeiten zur Betrugsprävention. Stellen Sie sich vor, wir könnten den digitalen Ozean von E-Mails, Dokumenten, Transaktionsaufzeichnungen und Webprotokollen auf Muster und Anomalien durchforsten, die auf verdächtige Aktivitäten oder gar Betrug hindeuten könnten.

Als Beispiel dafür, dass sich diese Technologien bereits in anderen Wirtschaftssektoren etabliert haben, möchte ich die Versicherungsbranche hervorheben. Dort gibt es Unternehmen, die sich auf die Analyse dieser Art von Daten spezialisiert haben. Sie kombinieren unterschiedliche Datenquellen und setzen fortschrittliche Analysemethoden ein. Und die Ergebnisse? Eine beeindruckende Reduzierung der Betrugsfälle und die Enttarnung organisierter Betrugsringe. KI wird darüber hinaus auch eingesetzt, um Schadensfälle besser zu bewerten, die Preisgestaltung zu optimieren und den Versicherungsschutz zu personalisieren.

Das waren nur wenige, einfache Beispiele. Sie alle hier können sicherlich noch Dutzende weitere beitragen.

Sie sehen, meine Damen und Herren, die Analyse unstrukturierter Daten ist nicht nur ein Thema für uns hier in der Bundesbank, sondern revolutioniert bereits die gesamte Finanzwirtschaft. 

4 Wie verändern unstrukturierte Daten das Finanzsystem und den Wettbewerb?

Meine Damen, meine Herren, und wenn wir uns heute die Frage stellen "Wie verändern unstrukturierte Daten das Finanzsystem und den Wettbewerb, wenn bereits heute schon so viel möglich ist?", dann sehen wir vor uns ein Bild sowohl mit Schatten als auch Licht.

Die gute Nachricht ist: Unstrukturierte Daten bergen große Chancen für unser Finanzsystem. 

Erstens: Überlegen Sie sich die Möglichkeiten, die unstrukturierte Daten den Banken eröffnen. Datenbasierte, analytische Ansätze ermöglichen präzisere Entscheidungen, etwa bei der Bonitätsprüfung oder der Kapitalanlage. Sie verbessern den Schutz vor Betrug oder Cyberattacken. Dies führt insgesamt zu stabileren Banken.

Zweitens: Betrachten Sie die Zentralbanken. Mit Zugang zu wertvollen Markt- und Aufsichtsdaten können sie die Vorteile der KI nutzen, um ihren Auftrag zur Wahrung von Preis- und Finanzstabilität noch besser zu erfüllen.

Und drittens: All diese Vorteile, von stabileren Banken bis hin zu effizienteren Zentralbanken, summieren sich zu einem insgesamt stabileren Finanzsystem, das durch die Analyse unstrukturierter Daten gestärkt wird.

Es wäre allzu einfach, uns von der schieren Macht und dem Potenzial dieser Daten hinreißen zu lassen. Doch wir dürfen uns nicht in einem naiven Fortschrittsglauben verlieren, sondern müssen auch die Risiken im Blick behalten. 

Erstens: Beim Maschinellen Lernen ist entscheidend: Die Qualität der Daten bestimmt den Erfolg unserer Algorithmen. Wie oft in der IT gesagt wird: „Garbage in, garbage out. Ein Algorithmus ist nur so gut wie seine Daten. Unvollständige oder fehlerhafte Daten bergen das Risiko unzuverlässiger Ergebnisse. Genau hier bringt der Zentralbereich Daten und Statistik der Bundesbank seine wertvolle Expertise ein.

Zweitens: Es ist riskant, sich auf Datenauswertungen ohne tiefgreifende Expertise zu verlassen. Angesichts der Flut an unstrukturierten Daten könnten wir ohne dieses Know-how der "blinden" Datenanalyse anheimfallen und einer Informationsillusion erliegen. Es genügt nicht, Daten zu besitzen – wir müssen sie auch richtig nutzen und verstehen können. 

Drittens: Ein nicht zu vernachlässigendes Risiko ist die öffentliche Wahrnehmung von Künstlicher Intelligenz. Laut einer Allensbach-Studie finden 58% den Begriff "Künstliche Intelligenz" unsympathisch und nur 23% sehen eine effektive Regulierung als realisierbar. Gerade im Sektor des Finanzwesens, in dem Vertrauen eine wichtige Rolle spielt, könnten solche Akzeptanzprobleme die Technologieeinführung deutlich behindern.

Schließlich ist es nicht nur eine Frage von Einzelrisiken wie Datenqualität. Die Funktionsweise von KI ist komplex. Sie kann uns durch unerwartete Fehler und prozyklische Effekte überraschen. Diese Herausforderungen, die sich aus der Nutzung von Big Data und unstrukturierten Daten ergeben, können weitreichende Auswirkungen auf unsere Finanzinstitutionen und die gesamte Stabilität des Systems haben.

Hier kommt wieder der Mensch ins Spiel, Sie und ich. Wir sind es, die letztlich die Verantwortung für Entscheidungen tragen. Dabei bleibt es.

Der Begriff der „Künstlichen Intelligenz“ war schon seit der ersten Verwendung 1955 eine maßlose Übertreibung. Und damals gab es noch gar keine „Big Data“.

Die Analyse unstrukturierter Daten ist am Ende doch nur ein Werkzeug des Menschen, das er sich selbst geschaffen hat.

Dass solche Werkzeuge allerdings bedrohliche Risiken und Nebenwirkungen haben können, wissen wir spätestens seit Goethes Zauberlehrling: Die ich rief, die Geister, werd‘ ich nun nicht los.

5 Fazit

Meine Damen, meine Herren, 

zusammenfassend lässt sich sagen, dass die facettenreiche Welt unstrukturierter Daten insgesamt ein großes Potenzial birgt, nicht nur für einzelne Institute, sondern für das gesamte Finanzsystem. 

Das Nutzbarmachen dieser Daten ist nicht nur technisch, sondern auch strategisch essenziell für Banken. In einem intensiv umkämpften Markt ist eine Investition hier besonders lohnenswert. Die gezielte Analyse von unstrukturierten Daten trägt zur Kosteneffizienz, Automatisierung, Betrugsprävention und einem verbesserten Risikomanagement bei.

Doch gehen mit diesen Neuerungen auch Risiken einher. Datenqualität und -kompetenz sind hier das A und O. 

Es geht nicht nur um das Abwägen von Risiken und Vorteilen. Vielmehr sollten wir Innovation und Stabilität als zwei Seiten der gleichen Münze sehen. Unstrukturierte Daten bieten uns enormes Potenzial, das es voll auszuschöpfen gilt, um für künftige Chancen und Risiken gewappnet zu sein. Dabei ist entscheidend, dass wir diese Daten so nutzen, dass die Vorteile maximiert und die Risiken minimiert werden. In diesem Kontext möchte ich hervorheben, dass man bei der Regulierung der Künstlichen Intelligenz ein ausgewogenes Maß finden sollte. Es wäre unklug, das immense Innovationspotenzial dieser Technologien durch übermäßige gesetzliche Einschränkungen zu dämpfen. Ähnlich unserem erfahrenen Fischer müssen wir wissen, wann wir unsere Netze auswerfen und zugleich wachsam gegenüber drohenden Stürmen sein.

Womöglich stehen wir an der Schwelle einer faszinierenden Ära. Die bevorstehenden Entwicklungen in KI und Finanzwesen bieten uns unglaubliche Möglichkeiten. Vor diesem Hintergrund freuen wir uns besonders auf den weiteren inspirierenden Austausch mit Ihnen – den Banken, Versicherern und FinTechs – um gemeinsam die Zukunft zu gestalten und den Datenozean zu erkunden.

Vielen Dank für Ihre Aufmerksamkeit!