AutoML [Teil 1]: Auf der Suche nach dem richtigen ML-Modell

Was ist der schnellste Weg das richtige ML-Modell für Finanz- und Risikoprozesse zu finden?

Mit Hilfe von “Auto-ML” Bibliotheken, welche Machine-Learning-Experimente automatisieren, kann dieses Problem schnell gelöst werden.

Der Weg eines ML-Modells bis zum Einsatz in der Prozessautomatisierung kann oft langwierig sein, da sowohl die Datenanalyse selbst als auch das Anforderungsmanagement sehr iterativ sind. In den Artikeln [Crisp DM Teil 1] und [Crisp DM Teil 2] wurde eine solche iterative Methodik namens CRISP-DM (Cross-Industry Standard Process for Data Mining) näher vorgestellt.

Des Weiteren müssen Data Scientists und ML-Ingenieure bei der Entwicklung eines ML-gestützten Prozesses oftmals viele verschiedene ML-Modelle testen, um das Richtige für ihren Anwendungsfall zu finden. Hinzu kommt, dass unterschiedliche Modelle unterschiedliche Datenaufbereitungsmethoden und die Einstellung modellspezifischer Hyperparameter benötigen. Doch manchmal ist eine schnelle und trotzdem präzise Lösung wichtig und die Zeit für detailliertes Experimentieren knapp bemessen.

 
 

In diesem Zusammenhang können Auto-ML Bibliotheken helfen! Sie führen nämlich Experimente mit vielen Aufbereitungsmethoden, vielen ML-Modellen und verschiedenen Hyperparametern vollautomatisiert durch (siehe auch Diagramm). Außerdem protokollieren sie gleichzeitig diese Experimente, sodass die Data Scientists und ML-Ingenieure nur noch zwischen den besten ML-Modellen für den Anwendungsfall wählen müssen. Anschließend können diese ihr Fachwissen darauf konzentrieren, ein vorselektiertes ML-Modell für ihren Finanz- und Risikoprozess zu optimieren bzw. einzubauen.

Somit ist Auto-ML der schnelle Weg das richtige ML-Modell für Finanz- und Risikoprozesse finden!

Im zweiten Teil werden drei Auto-ML Bibliotheken für die Programmiersprache Python vorgestellt: