Gradient Boosting - ein Modell für hohe Vorhersagegenauigkeit von Finanzparametern

In diesem Artikel wird eine Machine Learning Technik vorgestellt, die von Banken und anderen Finanzdienstleistern zur effizienten und genauen Klassifizierung von Kreditausfällen genutzt werden kann. Das Modell ist besonders aufgrund der hohen Genauigkeit, Geschwindigkeit und der Effizienz beliebt.

Viele Machine Learning Algorithmen und Methoden basieren auf der Verwendung eines einzelnen Vorhersagemodells (wie zum Beispiel Regressionen). Andere Methoden, wie beispielsweise der Random Forest, können die Vorhersagegenauigkeit verbessern, indem sie den Durchschnitt der Vorhersagen mehrerer einzelner Modelle bilden.

Weitere Verbesserungsmöglichkeiten der Vorhersagegenauigkeit lassen sich durch das sogenannte Boosting erreichen. Diese Methode kann grundsätzlich mit jedem Modelltyp verwendet werden. Die Ausgangslage bildet ein sogenanntes „schwaches“ Modell (hier ist die Fehlerrate nur geringfügig besser als das zufällige Erraten). Im nächsten Schritt wird basierend aus den Residuen des ersten Modells ein angepasstes Modell erstellt, das die Fehlerrate verbessert. Dieser Vorgang wird dann so lange wiederholt, bis man ein endgültiges Modell mit hoher Vorhersagegenauigkeit erhält. Der größte Vorteil der Boosting Methode ist die sehr hohe Vorhersagegenauigkeit. Dementgegen steht die sehr schwere Interpretierbarkeit der resultierenden Modelle.