Anomalieerkennung mittels KI

Was sind Datenanomalien und wie kann Künstliche Intelligenz dabei helfen diese zu erkennen?

Die schnelle und präzise Identifizierung von ungewöhnlichen Vorkommnissen innerhalb von Daten ist in vielen Bereichen von großer Bedeutung. Beispielsweise bei der Betrugserkennung und Cybersicherheit.

Intuitiv ist eine Datenanomalie eine Beobachtung, die wirkt als wäre sie unvereinbar mit den anderen Datenpunkten. Dabei treten sie selten innerhalb der Daten auf und ihre Merkmale weichen signifikant von den normalen Beobachtungen ab.

Es wird oft zwischen drei verschiedenen Arten von Anomalien unterschieden.

  1. Punktuelle Anomalien

    • betreffen nur einen Datensatz.

    • sind Beobachtungen, die relativ weit von den anderen entfernt sind.

  2. Kontextuelle Anomalien

    • betreffen nur einen Datensatz.

    • können nur in einem bestimmten Kontext beobachtet und identifiziert werden.

  3. Kollektive Anomalien

    • betreffen mehrere Datensätze.

    • können durch die Analyse der Beziehung zwischen den Datensätzen erkannt werden.

Mögliche Ursachen für Datenanomalien sind beispielsweise:

  • Menschliche Fehler

  • Datenverarbeitungsfehler

  • Geräte- bzw. Messfehler

  • Neuheiten in den Daten

  • Und vieles mehr

Ein klassischer Use Case in diesem Zusammenhang ist die Identifizierung von betrügerischen Aktivitäten. Diese können für Unternehmen zu einem finanziellen oder reputatorischen Schaden führen.

Der Isolation Forest Algorithmus, der auf Tree Ensembles basiert, kann dabei helfen auffällige Transaktionen zu erkennen und Betrugsversuche zu verhindern.

Eine andere Klasse von Methoden sind Clusteringverfahren. Diese ordnen Datenpunkte verschiedenen Clustern zu und können darauf aufbauend Anomalien identifizieren.

Mehr Informationen zu diesen Verfahren und Beispiele für die einzelnen Anomalienarten werden im folgenden Karussell vorgestellt.

 

Verfasst von Carsten Keller, Patrick T. Philipp

Links* zu den Referenzen** im Karussell

[1] Gavrilova, Y. "What Is Anomaly Detection in Machine Learning? Anomaly Detection in Machine Learning (serokell.io)

[2] Gülen, K. "Anomaly detection in machine learning"

Machine Learning Anomaly Detection Explained: Types, Approaches And More (dataconomy.com)

[3] Khan, M. "Anomaly Detection with Isolation Forest and Kernel Density Estimation"

Anomaly Detection with Isolation Forest and Kernel Density Estimation - MachineLearningMastery.com

[*]: Links abgerufen am 01.06.2023

[**]: Die Verlinkungen verweisen auf externe Daten außerhalb unserer Domain. Trotz sorgfältiger inhaltlicher Kontrolle übernehmen wir keine Haftung für die Inhalte externer Links.


Erfahren Sie mehr zum Thema:


Neugierig?

Entdecken Sie mehr über unsere Machine Learning Techniken

Wir stehen Ihnen bei Fragen zur Verfügung!