Assessing Unintended Memorization in Neural Discriminative Sequence Models

Mossad Helali; Thomas Kleinbauer; Dietrich Klakow

Communication Dans Un Congrès Année : 2020

Assessing Unintended Memorization in Neural Discriminative Sequence Models

(1) , (1) , (2)

1
2

Mossad Helali

Fonction : Auteur
PersonId : 1073841

Saarland University [Saarbrücken]

Thomas Kleinbauer

Fonction : Auteur
PersonId : 1073842

Saarland University [Saarbrücken]

Dietrich Klakow

Fonction : Auteur

Universität des Saarlandes [Saarbrücken]

Résumé

Despite their success in a multitude of tasks, neural models trained on natural language have been shown to memorize the intricacies of their training data, posing a potential privacy threat. In this work, we propose a metric to quantify unintended memorization in neural dis-criminative sequence models. The proposed metric, named d-exposure (discriminative exposure), utilizes language ambiguity and classification confidence to elicit the model's propensity to memorization. Through experimental work on a named entity recognition task, we show the validity of d-exposure to measure memorization. In addition, we show that d-exposure is not a measure of overfitting as it does not increase when the model overfits.

Mots clés

Named Entity Recognition Natural Language Understanding Privacy

Domaines

Informatique et langage [cs.CL]

Fichier principal

HelaliM+20.pdf (255.94 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Zaineb Chelly Dagdia : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-02880581

Soumis le : jeudi 25 juin 2020-17:20:08

Dernière modification le : samedi 27 juin 2020-03:09:27

Archivage à long terme le : mercredi 23 septembre 2020-15:44:26

Dates et versions

hal-02880581 , version 1 (25-06-2020)

Identifiants

HAL Id : hal-02880581 , version 1

Citer

Mossad Helali, Thomas Kleinbauer, Dietrich Klakow. Assessing Unintended Memorization in Neural Discriminative Sequence Models. 23rd International Conference on Text, Speech and Dialogue, Sep 2020, Brno, Czech Republic. ⟨hal-02880581⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

176 Consultations

288 Téléchargements

Assessing Unintended Memorization in Neural Discriminative Sequence Models

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Partager