Lineare und Logistische Regression

Können lineare Modelle auch zur Klassifikation verwendet werden? Wofür würden solche Modelle im Bereich Finanzen und Versicherung eingesetzt werden?

Das sogenannte Supervised Machine-Learning kann in zwei Aufgabegruppen unterteilt werden: Regression und Klassifikation. In unseren bisherigen Beiträgen haben wir verschiedene Aspekte linearer Modelle unter dem Blickwinkel der Regression vorgestellt, d.h. zur Schätzung einer kontinuierlichen Zielvariable.

Ein lineares Modell kann aber auch für Klassifikationsaufgaben erweitert werden, sodass eine binäre Zielvariable geschätzt wird. Die Beziehung zwischen den Input-Featuren X und der Zielvariable bleibt linear, sie werden jedoch durch eine S-Kurve transformiert. Danach liegt die endgültige Schätzung ŷ zwischen 0 und 1. Damit kann der Output nicht nur als binäre Klassifikation, sondern auch als die (Eintritts-)Wahrscheinlichkeit eines Ereignisses gesehen werden.

Dieses Modell heißt Logistische Regression und ist für Finanz- und Versicherungsbranche äußerst nützlich. Ein bekannter und branchenübergreifender Anwendungsfall ist die Customer Churn Prediction, bei der es darum geht Kündigungen durch Kunden vorherzusagen und deren Ursachen zu analysieren.

Im unteren Karussell erklären wir die Details der Logistischen Regression und wie man ihre Koeffizienten interpretiert anhand eines Customer Churn Anwendungsbeispiel.

 

Verfasst von Dr. Carsten Keller und Tom Walter

Mehr zur Theorie der OLS finden Sie im folgenden Beitrag:


Neugierig?

Entdecken Sie mehr über unsere Machine Learning Techniken

Wir stehen Ihnen bei Fragen zur Verfügung!