FDR control for Online Anomaly Detection - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2023

FDR control for Online Anomaly Detection

Contrôle du FDR pour la détection d'anomalies online

Résumé

The goal of anomaly detection is to identify observations generated by a process that is different from a reference one. An accurate anomaly detector must ensure low false positive and false negative rates. However in the online context such a constraint remains highly challenging due to the usual lack of control of the False Discovery Rate (FDR). In particular the online framework makes it impossible to use classical multiple testing approaches such as the Benjamini-Hochberg (BH) procedure. Our strategy overcomes this difficulty by exploiting a local control of the "modified FDR" (mFDR). An important ingredient in this control is the cardinality of the calibration set used for computing empirical p-values, which turns out to be an influential parameter. It results a new strategy for tuning this parameter, which yields the desired FDR control over the whole time series. The statistical performance of this strategy is analyzed by theoretical guarantees and its practical behavior is assessed by simulation experiments which support our conclusions.
L'objectif de la détection des anomalies est d'identifier les observations générées par un processus différent de celui de référence. Un détecteur d'anomalies précis doit garantir des taux de faux positifs et de faux négatifs faibles. Cependant, dans le contexte online, une telle contrainte reste très difficile en raison de l'absence habituelle de contrôle du taux de fausse découverte (FDR). En particulier, le cadre online rend impossible l'utilisation d'approches classiques de tests multiples telles que la procédure Benjamini-Hochberg (BH). Notre stratégie surmonte cette difficulté en exploitant un contrôle local du "FDR modifié" (mFDR). Un ingrédient important de ce contrôle est du cardinal de l'ensemble de calibration utilisé pour calculer les valeurs p empiriques, qui s'avère être un paramètre influent. Il en résulte une nouvelle stratégie de réglage de ce paramètre, qui permet d'obtenir le contrôle souhaité du FDR sur l'ensemble de la série temporelle. La performance statistique de cette stratégie est analysée par des garanties théoriques et son comportement pratique est évalué par des expériences de simulations qui soutiennent nos conclusions.
Fichier principal
Vignette du fichier
article1-preprint.pdf (2.58 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Licence : CC BY - Paternité

Dates et versions

hal-04321622 , version 1 (04-12-2023)

Identifiants

  • HAL Id : hal-04321622 , version 1

Citer

Etienne Krönert, Alain Célisse, Dalila Hattab. FDR control for Online Anomaly Detection. 2023. ⟨hal-04321622⟩
73 Consultations
53 Téléchargements

Partager

Gmail Facebook X LinkedIn More