Machine Learning im Finanzwesen: ein innovativer Ansatz zur Analyse von stillen Lasten/Reserven und weiterer Parameter

Photo by Marcus Lenk on Unsplash on 15.01.2021

In diesem Artikel wird die Verwendung von Skripting und innovativen ML-Techniken (Machine Learning bzw. Maschinelles Lernen) zur Automatisierung und Verbesserung der Analyse von stillen Lasten/Reserven (HRL | hidden reserves/losses) beschrieben, die üblicherweise innerhalb der Banken von den entsprechenden Finanzabteilungen im Rahmen ihrer Prozesse durchgeführt wird. Es wird gezeigt, wie zahlreiche quantitative Effekte, welche die Komponenten der Veränderung der HRL definieren, mit verschiedenen Machine Learning Algorithmen kategorisiert, erklärt und dargestellt werden können.

Der HRL-Prozess wird lediglich dazu betrachtet, um die Techniken anhand eines zugrunde liegenden Beispiels zu demonstrieren. Der in diesem Artikel skizzierte Ansatz ist nicht auf dieses Beispiel beschränkt, sondern universell anwendbar, wann immer ein Finanzparameter, dessen Wert von verschiedenen Merkmalen, wie z. B. Spreads, Zinskurven usw., beeinflusst wird, analysiert werden muss, um die treibenden Faktoren seiner Veränderung von einem Zeitpunkt zu einem anderen zu bestimmen.

Einführung in den HRL-Prozess

Stille Lasten und Reserven beschreiben nicht erfasste positive und negative Bewertungseffekte von zu Anschaffungskosten bilanzierten Finanzinstrumenten, die sich aus der Differenz zwischen Buchwert und Marktwert ergeben.

Darauf basierend wird die HRL für ein einzelnes Finanzinstrument gemäß der folgenden Formel definiert:

Gleichung 1: HRL Definition

wobei der Marktwert (MW) dem Fair Value (beizulegender Zeitwert) des Instruments entspricht, während der Buchwert (BW) der bilanzierte Wert in der Bilanz ist.

Die Veränderung der HRL (∆HRL) wird üblicherweise über einen bestimmten Zeitraum, z. B. drei Monate, berechnet und ist wie folgt definiert:

Gleichung 2: ∆HRL Definition

Die Größen ∆MW und ∆BW entsprechen definitionsgemäß

Gleichung 3: ∆MW Definition

und

Gleichung 4: ∆BW Definition

wobei t₂ > t₁ für die entsprechenden Betrachtungszeitpunkte gilt.

Die repetitive Berechnung der ∆HRL für ein großes Portfolio ist verhältnismäßig arbeits-, zeit- und ressourcenintensiv und beinhaltet in der Regel manuelle Schritte wie das Kopieren, Verschieben und Einfügen von Daten sowie die anschließende Analyse der veränderten Markt-/Buchwerte und deren Ausreißer.

Daraus ergeben sich verschiedene Möglichkeiten, wie man den Analyseprozess der ∆HRL für Portfolios weiter digitalisieren und optimieren kann. Es bedarf ganzheitlich koordinierter, innovativer Ansätze damit folgende Punkte umgesetzt werden können:

Automatisierung der Datenverarbeitung,

Durchführung von Feature Engineering und Feature Auswahl,

Erklärung der Änderung von HRL.

Bei den in diesem Artikel beschriebenen ML-Ansätzen gehören neben Zinskurven, Spreads und Wechselkursen auch Markt- und Buchwerte sowie deren Komponenten, welche wir fortan allesamt als Features bezeichnen, zum Repertoire der verwendeten Daten.

Automatisierte Datenaufbereitung mit RPA und/oder Python

Zur Berechnung der HRL eines Instruments und insbesondere zur Analyse der Gründe für HRL-Veränderungen von einem Stichtag zum Nächsten ist es in der Regel erforderlich, Daten aus verschiedenen Systemen zu extrahieren. In diesem Zusammenhang ist es wichtig zu bedenken, dass Markt- und Buchwert nicht nur einzelne Variablen sind, sondern selbst durch unterschiedliche Parameter (oder Features) definiert werden. So besteht zum Beispiel der Buchwert eines Instruments aus Parametern wie dem Nominalwert, Premium-Discount-Gebühren, weiteren Gebührenarten, Amortisationskosten usw. Gleichermaßen wird der Marktwert eines Instruments durch Features wie der Zinskurve, Spreads, etc. definiert.

Die manuelle Verarbeitung der verschiedenen Datenquellen erfordert in der Regel die Manipulation komplexer Datenstrukturen in Excel-Tabellen, was wiederum ressourcenintensiv und anfällig für unbeabsichtigte Fehler ist.

Ein besserer Ansatz die zugrundeliegenden Daten so zu verarbeiten, dass sie die Anwendung der beschriebenen Machine Learning Algorithmen begünstigen, ist die Automatisierung der Datenverarbeitung mithilfe von innovativen Prozessautomatisierungsansätzen wie Robotic Process Automation[1] (RPA) oder der Skriptsprache Python, die über spezielle eingebaute Bibliotheken für die Datenverarbeitung verfügt. Dies sorgt für mehr Transparenz, ermöglicht die Nachvollziehbarkeit von Änderungen, vereinfacht die Identifikation von Fehlern in den regelbasierten Datenverarbeitungsschritten und bringt darüber hinaus eine erhebliche Zeitersparnis.

Feature Engineering, Feature Auswahl und HRL Erklärung durch die Verwendung von Machine Learning

Nachdem die Grundvoraussetzung, nämlich die Umwandlung der rohen Input-Daten in ein bestimmtes Format geschaffen wurde, welches von Machine Learning Algorithmen verwendet werden kann, fährt man mit der Erstellung eines geeigneten Modells fort, das die Änderungen der HRL von einem Stichtag zum Nächsten basierend auf den ausgewählten/vordefinierten Features erklärt.

In diesem Zusammenhang wird in einem ersten Schritt festgelegt, welche Features im Modell verwendet werden sollen. Ein Ansatz besteht darin, zunächst die theoretischen Beziehungen zwischen der Zielvariable (HRL) und ihrer zugrundeliegenden Variablen zu betrachten, welche potenzielle Veränderungen erklären können. Weil die ΔHRL wie eingangs erwähnt als Differenz zwischen der Veränderung des Marktwertes und der Veränderung des Buchwertes dargestellt werden kann (siehe Gleichung 2), ist es sinnvoll Features zu ermitteln, welche die Komponenten ΔMW bzw. ΔBW beeinflussen.

Im Folgenden liegt der Schwerpunkt bei der Ermittlung jener Features, die den ΔMW erklären, jedoch können die beschriebenen Techniken in gleichem Maße auch auf den ΔBW angewendet werden.

Die allgemeine Formel zur Berechnung des Marktwerts eines Finanzinstruments, z. B. einer Anleihe, lautet wie folgt:

Gleichung 5: MW Definition

dabei werden die zukünftigen Cashflows (CF_t) zu verschiedenen Zeitpunkten t mit risikolosen Zinssätzen (r_t) und Spread-Werten (s_t) diskontiert.

Beispiel

Aus Gleichung 5 folgt, dass eine inverse Beziehung zwischen den Zinssätzen, Spreads und dem Marktwert besteht. Höhere Zinssätze oder Spread-Werte führen zu höheren Diskontierungssätzen und damit zu niedrigeren Marktwerten – wenn sich dabei der Buchwert nicht ändert oder cet. par. steigt, impliziert die Beziehung in Gleichung 1 eine niedrigere HRL.

Das Beispiel verdeutlicht, dass Zinssätze und Spreads als Features zur Erklärung der resultierenden Veränderungen der HRL herangezogen werden können.

Nachdem mit vergleichbaren Ansätzen eine hinreichend große Menge bestehend aus einer natürlichen Anzahl an p Features ermittelt wurde, die potenziell zur Erklärung der ΔHRL herangezogen werden können, besteht der nächste Schritt darin, eine geeignete Teilmenge auszuwählen, d. h. nur diejenigen Features zu selektieren, welche die sinnvollste Erklärung für die HRL-Bewegung liefern.

Ein ML-Verfahren, welches sich für die Feature-Auswahl unter Anwendung von Regularisierung eignet, ist die sogenannte Lasso (least absolute shrinkage and selection operator) Regression. Diese wird verwendet, um die Menge der bekannten Kovariaten (in unserem Fall die initial gewählte Ausgangsmenge an Features) zu reduzieren und damit die Interpretierbarkeit des resultierenden statistischen Modells zu verbessern. Mathematisch gesehen ist dabei das Ziel, einen speziellen Vektor β_lasso zu finden, der die Lasso-Verlustfunktion[2] ℒ minimiert:

Equation 6: β_lasso Definition

Man kann beobachten, dass die Zielfunktion auf der rechten Seite des Ausdrucks in Gleichung 6 einen Trade-Off zwischen der Passgenauigkeit und der Summe der Absolutbeträge der Koeffizienten darstellt – dieser Trade-Off wird durch den Regularisierungs-Hyperparameter λ gesteuert. Hohe Werte von λ führen zu einer niedrigeren Summe der Absolutbeträge der optimierten Koeffizienten in ‖β‖₁, während niedrige λ-Werte die Koeffizienten näher an die durch lineare Regression mit der Methode der kleinsten Quadrate (OLS) ermittelten Werte bringen. Der optimale Wert von λ wird hierbei durch Kreuzvalidierung[3] ermittelt.

Eine weitere Eigenschaft des Lasso-Schätzer ist, dass der Lösungsvektor β_lasso Komponenten enthalten kann, deren Beträge gleich Null sind. Dabei können die Komponenteneinträge von β_lasso als Gewichte der Features interpretiert werden, die eine Indikation dafür geben, wie aussagekräftig die Veränderung der jeweiligen Features gemäß dem abgeleiteten Lasso-Modell auf die Zielvariable sind. Dies ist eine nützliche Eigenschaft, die für eine Auswahl der aussagekräftigsten Features aus der anfänglichen Menge von p Kandidaten verwendet wird.

Wie bereits beschrieben, wird der optimale Wert des Regularisierungshyperparameters λ durch Kreuzvalidierung ausgewählt und anschließend die entsprechende Lasso-Regression auf den Datensatz angewendet. Der Schätzungsvektor β_lasso ist dünnbesetzt, was bedeutet, dass einige seiner Werte nahe bei oder genau gleich Null sind. Die entsprechenden Features werden als nicht relevant bzw. aussagekräftig angesehen und in den späteren Stufen der Analyse nicht verwendet, während die anderen Features, deren Koeffizienten hinreichend weit von Null entfernt sind, als wichtig und somit für das Model relevant erachtet werden.

Nachdem die aussagekräftigsten Features mittels Lasso-Regression ausgewählt wurden, ist das Ziel, ihren Effekt auf die Zielvariable, in unserem Fall die ΔHRL, zu schätzen. Dies kann durch ein lineares Regressionsmodell erreicht werden, das versucht, die relevanten Koeffizienten β_i in der folgenden funktionalen Beziehung zu schätzen, während die Koeffizienten eliminierter Features künstlich auf Null gesetzt werden:

Equation 7: Lineares Regressionsmodell

In Gleichung 7 ist y_j der Wert der Zielvariable (hier ΔHRL) für die Beobachtung j (das jeweilige Finanzinstrument). Die Menge {x_ij}^p_i=1 enthält die Werte einzelner Features (z. B. eine Änderung des Zinssatzes in bestimmter Höhe) für die Beobachtung j, während {β_i}^p_i=1 die Feature-Koeffizienten beinhaltet, d. h. Parameter des Modells, welche geschätzt werden müssen, oder vor der Schätzung auf Null festgesetzt wurden.

Die Feature-Koeffizienten können durch Lösen eines Optimierungsproblems der gewöhnlichen kleinsten Quadrate (OLS[4]) geschätzt werden:

Gleichung 8: OLS Optimierungsproblem

Das OLS-Optimierungsproblem konzentriert sich im Gegensatz zum Lasso-Ansatz von einem mathematischen Standpunkt aus betrachtet auf die Minimierung der quadrierten Residuen der linearen Regression und nicht direkt auf die mittleren Absolutwerte der Koeffizienten.

Infolgedessen gehen Residuen mit einem hohen Absolutwert (Randfälle) stärker in die Lösung ein und machen das Modell weniger verallgemeinerbar. Um diesen Effekt abzuschwächen, kann man die Ausreißer in der Verteilung der Zielvariable eliminieren, indem man die Reichweite der Verteilung auf ein kleineres Intervall beschränkt[5].

Nachdem die Koeffizienten mit Hilfe des OLS-Ansatzes geschätzt wurden, kann man die Auswirkungen einzelner Features auf die Zielvariable entweder für Gruppen bestimmter Instrumente oder sogar für ein einzelnes Finanzinstrument schätzen, wobei ersteres zuverlässiger funktioniert. Dies wird erreicht, indem man die Werte der Features für das Instrument mit den jeweiligen durch das OLS-Modell optimierten Koeffizienten multipliziert.

Praktische Implementierung

Der im vorangegangenen Abschnitt beschriebene theoretische Ansatz, mit dem die treibenden Faktoren, welche die ΔHRL bzw. insbesondere den ΔMW beeinflussen, erklärt werden können, ermöglicht nunmehr einen Weg für die praktische Umsetzung.

Es wurde argumentiert, dass es aufgrund theoretischer Überlegungen sinnvoll ist, Änderungen von Zinssätzen und Spreads als Features aufzunehmen. Neben diesen beiden Variablen können zudem einerseits kontinuierliche (stetige) Features[6] wie Buchwert- (ΔBW), Nominal- (ΔN) und Fair-Value-Anpassungsänderungen (ΔFVA) sowie andererseits kategoriale (diskrete) Features[7] wie Hedging- und Währungsinformationen für die Erklärung der Änderungen der ΔHRL nützlich sein und werden daher in die Betrachtung einbezogen.

Die Anwendung des Lasso-Regressionsschätzers auf den zugrunde liegenden Datensatz kann in der Theorie dazu führen, dass sowohl bestimmte stetige als auch kategoriale Features für die weitere Analyse durch unbedeutende Koeffizienten eliminiert werden können. Für das bestimmte Portfolio, dass der weiteren Analyse zugrunde liegt, wurden alle Koeffizienten der kategorialen Merkmale auf Null gesetzt, was grundsätzlich bedeutet, dass sie in der weiteren Analyse nicht aussagekräftig sind. Dies ist auf die Eigenschaften des Lasso-Modells und die vorliegenden Daten des Portfolios zurückzuführen.

Die verbleibenden kontinuierlichen Features definieren die jeweiligen Parameter (y_j, {x_ij}^p_i=1 and {β_i}^p_i=1) des in Gleichung 7 angegebenen OLS-Modells und bilden somit die funktionale Beziehung zwischen ΔHRL und den erklärenden Variablen/Features (siehe Gleichung 9). Mit den entsprechenden Portfolio Daten ergeben sich die Parameter in {β_i}^p_i=1 durch Lösen des in Gleichung 8 dargestellten OLS-Optimierungsproblems und werden anschließend quantitativ in Gleichung 9 dargestellt. Diese Parameter erfassen die funktionale Beziehung zwischen der Zielvariable ΔHRL (y_j in Gleichung 7) und besonders relevanten Features, wie ΔIR, ΔBW und weiteren ({x_ij}^p_i=1 in Gleichung 7).

Gleichung 9: Funktionale Beziehung zwischen der ∆HRL und den relevantesten Features

Hinsichtlich der Vorzeichen der Koeffizienten zeigt Gleichung 9, dass das Modell eine negative Beziehung zwischen der Zielvariable ΔHRL und den Änderungen der Spreads (ΔS) sowie der Zinssätze (ΔIR) erkennt.

Unter Verwendung der geschätzten linearen Funktion ist es nun möglich, die Auswirkungen der Features auf die Zielvariable für ein einzelnes Finanzinstrument näherungsweise zu berechnen. Dazu muss man die eingangs optimierten Koeffizienten mit den exakten Werten der erklärenden Variablen multiplizieren. In Bezug auf Gleichung 7 entspricht der approximative Effekt von Feature i auf die ΔHRL dem Produkt β_i x_ij, wobei β_i der i-te Koeffizient und x_ij die i-te erklärende Variable/Feature für Finanzinstrument j ist. Unter Anwendung des Modells aus Gleichung 9 kann der Effekt der Zinsänderung auf die ΔHRL durch Multiplikation des entsprechenden Koeffizienten (-374.147) mit dem konkreten Wert des Features (ΔIR) des jeweiligen Finanzinstruments berechnet werden.

Werte in EUR	ΔMW	ΔBW	ΔHRL
Kredit 1	809,565	1,253,115	-443,550
Kredit 2	-184,365	-322,602	138,013

Tabelle 1: Aufteilung der ΔHRL in EUR für zwei spezifische Beispiele von Krediten in den ΔMW und ΔBW.

In Tabelle 1 sind die ΔHRL-Berechnungen auf Basis der veränderten Buch- und Marktwerte für zwei einzelne Kredite dargestellt. Es kann beobachtet werden, dass Kredit 1 eine ΔHRL-Reduzierung erfährt, da die Höhe von ΔBW den Anstieg des ΔMW überwiegt. Auf der anderen Seite zeigt Kredit 2 einen Anstieg der ΔHRL, weil der Rückgang des ΔBW größer ist als der Rückgang des ΔMW.

Basierend auf dem in Gleichung 9 dargestellten linearen Modell und den beiden in Tabelle 1 angegebenen Krediten können nun die Auswirkungen weiterer einzelner Features auf die ΔHRL geschätzt werden[8]. Sie sind in Abbildung 1 und Abbildung 2 dargestellt.

Abbildung 1: Aufspaltung der ΔHRL in EUR für Kredit 1 in verschiedene Effekte. Die positiven Effekte werden als grüne Balken dargestellt, negative Effekte als rote Balken und die Vorhersage der HRL-Änderung wird als blauer Balken visualisiert. Als R… — Abbildung 1: Aufspaltung der ΔHRL in EUR für Kredit 1 in verschiedene Effekte. Die positiven Effekte werden als grüne Balken dargestellt, negative Effekte als rote Balken und die Vorhersage der HRL-Änderung wird als blauer Balken visualisiert. Als Referenz wird die tatsächliche HRL-Änderung (ΔHRL) als grauer Balken vergleichend der Vorhersage nebeneinandergestellt.

Wie oben erwähnt, wird der Effekt eines einzelnen Features bestimmt, indem der Koeffizient des linearen Modells mit dem entsprechenden Wert der erklärenden Variablen multipliziert wird. Wenn zum Beispiel die Buchwertänderung für Kredit 1 1.253.115 EUR ist und der Koeffizient -0,38, dann kann der Effekt von ΔBW auf die ΔHRL wie folgt berechnet werden.

Gleichung 10: Näherungsweise Berechnung der quantitativen Auswirkung von ∆BW auf die ∆HRL

Die Berechnung der Effekte für die anderen Variablen/Features kann auf analoge Weise durchgeführt werden.

Es ist zu beachten, dass der in diesem Artikel vorgestellte Ansatz bei der Berechnung der Effekte auf Instrumentenebene keine exakte Schätzung erzeugt. Dies führt zu Unterschieden zwischen der mit dem vorgestellten Modell geschätzten ΔHRL und der tatsächlichen ΔHRL. Diese Fehler heben sich auf Portfolioebene aufgrund bestimmter mathematischer Eigenschaften hinreichend gut auf. Trotz der unvollkommenen Genauigkeit der Vorhersage, die durch das Hinzufügen weiterer Features und/oder durch die Anwendung anderer Machine-Learning-Modelle verbessert werden kann, liegt der große Vorteil des linearen Regressionsansatzes in seiner Interpretierbarkeit, welche die Berechnung der quantitativen Effekte ermöglicht.

Abbildung 2: Aufspaltung der ΔHRL in EUR für Kredit 2 in verschiedene Effekte. Die positiven Effekte werden als grüne Balken dargestellt, negative Effekte als rote Balken und die Vorhersage der HRL-Änderung wird als blauer Balken visualisiert. Als R… — Abbildung 2: Aufspaltung der ΔHRL in EUR für Kredit 2 in verschiedene Effekte. Die positiven Effekte werden als grüne Balken dargestellt, negative Effekte als rote Balken und die Vorhersage der HRL-Änderung wird als blauer Balken visualisiert. Als Referenz wird die tatsächliche HRL-Änderung (ΔHRL) als grauer Balken vergleichend der Vorhersage nebeneinandergestellt.

Anhand der (visuellen) Darstellung lässt sich feststellen, welche Effekte den stärksten Einfluss auf die ΔHRL haben. So ist für den ersten Kredit die Änderung des Buchwerts der bedeutendste Parameter (vgl. Abbildung 1). Im Falle des zweiten Kredits hat die Veränderung der Zinssätze den stärksten Einfluss auf die Zielvariable (vgl. Abbildung 2).

Fazit

Die Einführung innovativer Machine Learning Techniken hat in der Finanzdienstleistungsbranche zu nachhaltigen Änderungen in der Prozesslandschaft geführt. Wie im konkreten Fall gezeigt, ergeben sich durch die Anwendung spezieller Algorithmen und unter Zuhilfenahme gelabelter Daten, neue Perspektiven um die Approximation sowie die Vorhersage quantitativer Effekte zu modernisieren, zugrunde liegende Effekte zu erklären und insgesamt die Performance der ursprünglichen manuellen Berechnungsweisen erheblich zu steigern.

Zusammen mit einer automatisierten, regelbasierten Vorverarbeitung können die neuen Techniken, sofern sie sinnvoll eingesetzt werden, Menschen einen erheblichen Vorteil bei der Verarbeitung und Identifizierung von Unregelmäßigkeiten (oder Ausnahmen) verschaffen, die sich möglicherweise in den zugrundeliegenden Daten verstecken.

Die in diesem Artikel dargestellte und auf maschinellem Lernen basierende Technik setzt diese Ansprüche um und macht den Weg frei für eine rapide und intuitive Erklärung der zugrunde liegenden Effekte bei der Untersuchung von Parametern, wie beispielsweise dem beizulegenden Zeitwert oder dem Buchwert von Finanzinstrumenten. In diesem Kontext ist die Anwendung der Technik nicht auf das HRL-Verfahren beschränkt, dass in diesem Artikel lediglich als Beispiel verwendet wird, sondern kann in den verschiedensten Bereichen angewendet werden, in denen der Wert solcher Parameter quantitativ durch evidente Größen bestimmt wird.

Unser Angebot

Die in diesem Dokument vorgestellten ML-Algorithmen und methodischen regelbasierten Automatisierungsansätze ermöglichen verschiedene Implementierungsstrategien für Finanzinstitute, z. B. in Prozessen, die im Zusammenhang stehen mit der Ermittlung der HRL, Hedge Accounting, etc.

Gerne beraten wir Sie zu verschiedenen automatisierten ML-Anwendungen und helfen Ihnen, die Lösung zu entwickeln, die im Rahmen der fachlichen und technischen Möglichkeiten adäquat für Ihr Unternehmen geeignet ist.

Referenzen

[1] Einen Überblick zum Thema Robotic Process Automation gibt der folgende Artikel https://www.finbridge.de/aktuelles/2019/7/9/how-to-rpa?rq=rpa, abgerufen am 30.01.2021

[2] Im Ausdruck ist y ein n-dimensionaler (n ≙ #Beobachtungen) Zielvektor, der die Zielwerte enthält (in unserem Fall die ΔHRL für einzelne Finanzinstrumente). X ist eine n × (p + 1) Matrix von spaltenweise angeordneten Features, z. B., Spread- oder Zinsänderungen, wobei (p + 1) die Anzahl der Features (in unserem Fall p Features in der initialen Ausgangsmenge) plus dem konstanten Term entspricht. β und β_lasso sind ebenfalls (p + 1)-dimensionale Vektoren. Ihre Dimensionalität entspricht der Anzahl der Spalten der Matrix X. λ ≥ 0 ist ein skalarer Regularisierungs-Hyperparameter, der angibt, inwieweit hohe Absolutkomponenten von β bestraft werden (der Fall λ = 0 ergibt die gewöhnliche Methode der kleinsten Quadrate OLS). Die zugehörigen Normen entsprechen ℓ₁ und ℓ₂.

[3] Bei der Kreuzvalidierung wird der Schätzer wiederholt auf einem Teil des Datensatzes berechnet und für verschiedene Werte des Regularisierungshyperparameters auf einem anderen ausgewertet. Letztlich wird der Parameterwert ausgewählt, der eine optimale Out-of-Sample-Performance auf den Hold-out-Daten erzielt.

[4] Das OLS-Optimierungsproblem (ordinary least squares) ist ein Spezialfall (für λ = 0) des Lasso-Optimierungsproblems. Die Merkmale (Variablendefinitionen, Dimensionen, usw.) sind die gleichen wie beim Lasso-Optimierungsproblem - diese finden Sie in Fußnote 2.

[5] Die Werte der Ausreiser unterhalb des α-Quantils werden auf den α-Quantilwert und Werte oberhalb des (1 - α)-Quantils auf den (1 - α)-Quantilwert gesetzt. α ist typischerweise klein, d. h. 0.01 oder 0.025.

[6] Kontinuierliche Features können einen reellen Zahlenwert mit beliebiger Genauigkeit erreichen. Zum Beispiel kann der Buchwert eines Finanzinstruments theoretisch gleich einer beliebigen nicht negativen Gleitkommazahl sein.

[7] Kategoriale Features können nur einer begrenzten Anzahl von Werten entsprechen. Zum Beispiel kann das Feature Währung in unserem speziellen Datensatz nur die Werte "EUR", "USD", "CHF" und "GBP" annehmen.

[8] Die Features ΔFVA, ΔIR, ΔN und ΔS sind in Tabelle 1 nicht explizit angegeben.

Als PDF Lesen