Machine Learning im Finanzwesen: ein innovativer Ansatz zur Analyse von stillen Lasten/Reserven und weiterer Parameter
In diesem Artikel wird die Verwendung von Skripting und innovativen ML-Techniken (Machine Learning bzw. Maschinelles Lernen) zur Automatisierung und Verbesserung der Analyse von stillen Lasten/Reserven (HRL | hidden reserves/losses) beschrieben, die üblicherweise innerhalb der Banken von den entsprechenden Finanzabteilungen im Rahmen ihrer Prozesse durchgeführt wird. Es wird gezeigt, wie zahlreiche quantitative Effekte, welche die Komponenten der Veränderung der HRL definieren, mit verschiedenen Machine Learning Algorithmen kategorisiert, erklärt und dargestellt werden können.
Der HRL-Prozess wird lediglich dazu betrachtet, um die Techniken anhand eines zugrunde liegenden Beispiels zu demonstrieren. Der in diesem Artikel skizzierte Ansatz ist nicht auf dieses Beispiel beschränkt, sondern universell anwendbar, wann immer ein Finanzparameter, dessen Wert von verschiedenen Merkmalen, wie z. B. Spreads, Zinskurven usw., beeinflusst wird, analysiert werden muss, um die treibenden Faktoren seiner Veränderung von einem Zeitpunkt zu einem anderen zu bestimmen.
Einführung in den HRL-Prozess
wobei der Marktwert (MW) dem Fair Value (beizulegender Zeitwert) des Instruments entspricht, während der Buchwert (BW) der bilanzierte Wert in der Bilanz ist.
Die Veränderung der HRL (∆HRL) wird üblicherweise über einen bestimmten Zeitraum, z. B. drei Monate, berechnet und ist wie folgt definiert:
Die Größen ∆MW und ∆BW entsprechen definitionsgemäß
und
wobei t2 > t1 für die entsprechenden Betrachtungszeitpunkte gilt.
Die repetitive Berechnung der ∆HRL für ein großes Portfolio ist verhältnismäßig arbeits-, zeit- und ressourcenintensiv und beinhaltet in der Regel manuelle Schritte wie das Kopieren, Verschieben und Einfügen von Daten sowie die anschließende Analyse der veränderten Markt-/Buchwerte und deren Ausreißer. Daraus ergeben sich verschiedene Möglichkeiten, wie man den Analyseprozess der ∆HRL für Portfolios weiter digitalisieren und optimieren kann. Es bedarf ganzheitlich koordinierter, innovativer Ansätze damit folgende Punkte umgesetzt werden können:- Automatisierung der Datenverarbeitung,
- Durchführung von Feature Engineering und Feature Auswahl,
- Erklärung der Änderung von HRL.
Zur Berechnung der HRL eines Instruments und insbesondere zur Analyse der Gründe für HRL-Veränderungen von einem Stichtag zum Nächsten ist es in der Regel erforderlich, Daten aus verschiedenen Systemen zu extrahieren. In diesem Zusammenhang ist es wichtig zu bedenken, dass Markt- und Buchwert nicht nur einzelne Variablen sind, sondern selbst durch unterschiedliche Parameter (oder Features) definiert werden. So besteht zum Beispiel der Buchwert eines Instruments aus Parametern wie dem Nominalwert, Premium-Discount-Gebühren, weiteren Gebührenarten, Amortisationskosten usw. Gleichermaßen wird der Marktwert eines Instruments durch Features wie der Zinskurve, Spreads, etc. definiert.
Die manuelle Verarbeitung der verschiedenen Datenquellen erfordert in der Regel die Manipulation komplexer Datenstrukturen in Excel-Tabellen, was wiederum ressourcenintensiv und anfällig für unbeabsichtigte Fehler ist.
Ein besserer Ansatz die zugrundeliegenden Daten so zu verarbeiten, dass sie die Anwendung der beschriebenen Machine Learning Algorithmen begünstigen, ist die Automatisierung der Datenverarbeitung mithilfe von innovativen Prozessautomatisierungsansätzen wie Robotic Process Automation[1] (RPA) oder der Skriptsprache Python, die über spezielle eingebaute Bibliotheken für die Datenverarbeitung verfügt. Dies sorgt für mehr Transparenz, ermöglicht die Nachvollziehbarkeit von Änderungen, vereinfacht die Identifikation von Fehlern in den regelbasierten Datenverarbeitungsschritten und bringt darüber hinaus eine erhebliche Zeitersparnis.
Feature Engineering, Feature Auswahl und HRL Erklärung durch die Verwendung von Machine Learning
Nachdem die Grundvoraussetzung, nämlich die Umwandlung der rohen Input-Daten in ein bestimmtes Format geschaffen wurde, welches von Machine Learning Algorithmen verwendet werden kann, fährt man mit der Erstellung eines geeigneten Modells fort, das die Änderungen der HRL von einem Stichtag zum Nächsten basierend auf den ausgewählten/vordefinierten Features erklärt.
In diesem Zusammenhang wird in einem ersten Schritt festgelegt, welche Features im Modell verwendet werden sollen. Ein Ansatz besteht darin, zunächst die theoretischen Beziehungen zwischen der Zielvariable (HRL) und ihrer zugrundeliegenden Variablen zu betrachten, welche potenzielle Veränderungen erklären können. Weil die ΔHRL wie eingangs erwähnt als Differenz zwischen der Veränderung des Marktwertes und der Veränderung des Buchwertes dargestellt werden kann (siehe Gleichung 2), ist es sinnvoll Features zu ermitteln, welche die Komponenten ΔMW bzw. ΔBW beeinflussen.
Im Folgenden liegt der Schwerpunkt bei der Ermittlung jener Features, die den ΔMW erklären, jedoch können die beschriebenen Techniken in gleichem Maße auch auf den ΔBW angewendet werden.
Die allgemeine Formel zur Berechnung des Marktwerts eines Finanzinstruments, z. B. einer Anleihe, lautet wie folgt:
Beispiel
Man kann beobachten, dass die Zielfunktion auf der rechten Seite des Ausdrucks in Gleichung 6 einen Trade-Off zwischen der Passgenauigkeit und der Summe der Absolutbeträge der Koeffizienten darstellt – dieser Trade-Off wird durch den Regularisierungs-Hyperparameter λ gesteuert. Hohe Werte von λ führen zu einer niedrigeren Summe der Absolutbeträge der optimierten Koeffizienten in ‖β‖1, während niedrige λ-Werte die Koeffizienten näher an die durch lineare Regression mit der Methode der kleinsten Quadrate (OLS) ermittelten Werte bringen. Der optimale Wert von λ wird hierbei durch Kreuzvalidierung[3] ermittelt.
Eine weitere Eigenschaft des Lasso-Schätzer ist, dass der Lösungsvektor βlasso Komponenten enthalten kann, deren Beträge gleich Null sind. Dabei können die Komponenteneinträge von βlasso als Gewichte der Features interpretiert werden, die eine Indikation dafür geben, wie aussagekräftig die Veränderung der jeweiligen Features gemäß dem abgeleiteten Lasso-Modell auf die Zielvariable sind. Dies ist eine nützliche Eigenschaft, die für eine Auswahl der aussagekräftigsten Features aus der anfänglichen Menge von p Kandidaten verwendet wird. Wie bereits beschrieben, wird der optimale Wert des Regularisierungshyperparameters λ durch Kreuzvalidierung ausgewählt und anschließend die entsprechende Lasso-Regression auf den Datensatz angewendet. Der Schätzungsvektor βlasso ist dünnbesetzt, was bedeutet, dass einige seiner Werte nahe bei oder genau gleich Null sind. Die entsprechenden Features werden als nicht relevant bzw. aussagekräftig angesehen und in den späteren Stufen der Analyse nicht verwendet, während die anderen Features, deren Koeffizienten hinreichend weit von Null entfernt sind, als wichtig und somit für das Model relevant erachtet werden. Nachdem die aussagekräftigsten Features mittels Lasso-Regression ausgewählt wurden, ist das Ziel, ihren Effekt auf die Zielvariable, in unserem Fall die ΔHRL, zu schätzen. Dies kann durch ein lineares Regressionsmodell erreicht werden, das versucht, die relevanten Koeffizienten βi in der folgenden funktionalen Beziehung zu schätzen, während die Koeffizienten eliminierter Features künstlich auf Null gesetzt werden:Praktische Implementierung
In Tabelle 1 sind die ΔHRL-Berechnungen auf Basis der veränderten Buch- und Marktwerte für zwei einzelne Kredite dargestellt. Es kann beobachtet werden, dass Kredit 1 eine ΔHRL-Reduzierung erfährt, da die Höhe von ΔBW den Anstieg des ΔMW überwiegt. Auf der anderen Seite zeigt Kredit 2 einen Anstieg der ΔHRL, weil der Rückgang des ΔBW größer ist als der Rückgang des ΔMW.
Basierend auf dem in Gleichung 9 dargestellten linearen Modell und den beiden in Tabelle 1 angegebenen Krediten können nun die Auswirkungen weiterer einzelner Features auf die ΔHRL geschätzt werden[8]. Sie sind in Abbildung 1 und Abbildung 2 dargestellt.
Abbildung 1: Aufspaltung der ΔHRL in EUR für Kredit 1 in verschiedene Effekte. Die positiven Effekte werden als grüne Balken dargestellt, negative Effekte als rote Balken und die Vorhersage der HRL-Änderung wird als blauer Balken visualisiert. Als Referenz wird die tatsächliche HRL-Änderung (ΔHRL) als grauer Balken vergleichend der Vorhersage nebeneinandergestellt.
Wie oben erwähnt, wird der Effekt eines einzelnen Features bestimmt, indem der Koeffizient des linearen Modells mit dem entsprechenden Wert der erklärenden Variablen multipliziert wird. Wenn zum Beispiel die Buchwertänderung für Kredit 1 1.253.115 EUR ist und der Koeffizient -0,38, dann kann der Effekt von ΔBW auf die ΔHRL wie folgt berechnet werden.
Die Berechnung der Effekte für die anderen Variablen/Features kann auf analoge Weise durchgeführt werden.
Es ist zu beachten, dass der in diesem Artikel vorgestellte Ansatz bei der Berechnung der Effekte auf Instrumentenebene keine exakte Schätzung erzeugt. Dies führt zu Unterschieden zwischen der mit dem vorgestellten Modell geschätzten ΔHRL und der tatsächlichen ΔHRL. Diese Fehler heben sich auf Portfolioebene aufgrund bestimmter mathematischer Eigenschaften hinreichend gut auf. Trotz der unvollkommenen Genauigkeit der Vorhersage, die durch das Hinzufügen weiterer Features und/oder durch die Anwendung anderer Machine-Learning-Modelle verbessert werden kann, liegt der große Vorteil des linearen Regressionsansatzes in seiner Interpretierbarkeit, welche die Berechnung der quantitativen Effekte ermöglicht.
Abbildung 2: Aufspaltung der ΔHRL in EUR für Kredit 2 in verschiedene Effekte. Die positiven Effekte werden als grüne Balken dargestellt, negative Effekte als rote Balken und die Vorhersage der HRL-Änderung wird als blauer Balken visualisiert. Als Referenz wird die tatsächliche HRL-Änderung (ΔHRL) als grauer Balken vergleichend der Vorhersage nebeneinandergestellt.
Anhand der (visuellen) Darstellung lässt sich feststellen, welche Effekte den stärksten Einfluss auf die ΔHRL haben. So ist für den ersten Kredit die Änderung des Buchwerts der bedeutendste Parameter (vgl. Abbildung 1). Im Falle des zweiten Kredits hat die Veränderung der Zinssätze den stärksten Einfluss auf die Zielvariable (vgl. Abbildung 2).
Fazit
Die Einführung innovativer Machine Learning Techniken hat in der Finanzdienstleistungsbranche zu nachhaltigen Änderungen in der Prozesslandschaft geführt. Wie im konkreten Fall gezeigt, ergeben sich durch die Anwendung spezieller Algorithmen und unter Zuhilfenahme gelabelter Daten, neue Perspektiven um die Approximation sowie die Vorhersage quantitativer Effekte zu modernisieren, zugrunde liegende Effekte zu erklären und insgesamt die Performance der ursprünglichen manuellen Berechnungsweisen erheblich zu steigern.
Zusammen mit einer automatisierten, regelbasierten Vorverarbeitung können die neuen Techniken, sofern sie sinnvoll eingesetzt werden, Menschen einen erheblichen Vorteil bei der Verarbeitung und Identifizierung von Unregelmäßigkeiten (oder Ausnahmen) verschaffen, die sich möglicherweise in den zugrundeliegenden Daten verstecken.
Die in diesem Artikel dargestellte und auf maschinellem Lernen basierende Technik setzt diese Ansprüche um und macht den Weg frei für eine rapide und intuitive Erklärung der zugrunde liegenden Effekte bei der Untersuchung von Parametern, wie beispielsweise dem beizulegenden Zeitwert oder dem Buchwert von Finanzinstrumenten. In diesem Kontext ist die Anwendung der Technik nicht auf das HRL-Verfahren beschränkt, dass in diesem Artikel lediglich als Beispiel verwendet wird, sondern kann in den verschiedensten Bereichen angewendet werden, in denen der Wert solcher Parameter quantitativ durch evidente Größen bestimmt wird.
Unser Angebot
Die in diesem Dokument vorgestellten ML-Algorithmen und methodischen regelbasierten Automatisierungsansätze ermöglichen verschiedene Implementierungsstrategien für Finanzinstitute, z. B. in Prozessen, die im Zusammenhang stehen mit der Ermittlung der HRL, Hedge Accounting, etc.
Gerne beraten wir Sie zu verschiedenen automatisierten ML-Anwendungen und helfen Ihnen, die Lösung zu entwickeln, die im Rahmen der fachlichen und technischen Möglichkeiten adäquat für Ihr Unternehmen geeignet ist.
[1] Einen Überblick zum Thema Robotic Process Automation gibt der folgende Artikel https://www.finbridge.de/aktuelles/2019/7/9/how-to-rpa?rq=rpa, abgerufen am 30.01.2021
[2] Im Ausdruck ist y ein n-dimensionaler (n ≙ #Beobachtungen) Zielvektor, der die Zielwerte enthält (in unserem Fall die ΔHRL für einzelne Finanzinstrumente). X ist eine n × (p + 1) Matrix von spaltenweise angeordneten Features, z. B., Spread- oder Zinsänderungen, wobei (p + 1) die Anzahl der Features (in unserem Fall p Features in der initialen Ausgangsmenge) plus dem konstanten Term entspricht. β und βlasso sind ebenfalls (p + 1)-dimensionale Vektoren. Ihre Dimensionalität entspricht der Anzahl der Spalten der Matrix X. λ ≥ 0 ist ein skalarer Regularisierungs-Hyperparameter, der angibt, inwieweit hohe Absolutkomponenten von β bestraft werden (der Fall λ = 0 ergibt die gewöhnliche Methode der kleinsten Quadrate OLS). Die zugehörigen Normen entsprechen ℓ1 und ℓ2. [3] Bei der Kreuzvalidierung wird der Schätzer wiederholt auf einem Teil des Datensatzes berechnet und für verschiedene Werte des Regularisierungshyperparameters auf einem anderen ausgewertet. Letztlich wird der Parameterwert ausgewählt, der eine optimale Out-of-Sample-Performance auf den Hold-out-Daten erzielt. [4] Das OLS-Optimierungsproblem (ordinary least squares) ist ein Spezialfall (für λ = 0) des Lasso-Optimierungsproblems. Die Merkmale (Variablendefinitionen, Dimensionen, usw.) sind die gleichen wie beim Lasso-Optimierungsproblem - diese finden Sie in Fußnote 2. [5] Die Werte der Ausreiser unterhalb des α-Quantils werden auf den α-Quantilwert und Werte oberhalb des (1 - α)-Quantils auf den (1 - α)-Quantilwert gesetzt. α ist typischerweise klein, d. h. 0.01 oder 0.025. [6] Kontinuierliche Features können einen reellen Zahlenwert mit beliebiger Genauigkeit erreichen. Zum Beispiel kann der Buchwert eines Finanzinstruments theoretisch gleich einer beliebigen nicht negativen Gleitkommazahl sein. [7] Kategoriale Features können nur einer begrenzten Anzahl von Werten entsprechen. Zum Beispiel kann das Feature Währung in unserem speziellen Datensatz nur die Werte "EUR", "USD", "CHF" und "GBP" annehmen. [8] Die Features ΔFVA, ΔIR, ΔN und ΔS sind in Tabelle 1 nicht explizit angegeben.