Clustering Spectral avec Contraintes de Paires réglées par Noyaux Gaussiens

David Chatel 1 Pascal Denis 1 Marc Tommasi 1
1 MAGNET - Machine Learning in Information Networks
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe
Résumé : Résumé Nous considérons le problème du clustering spectral partielle-ment supervisé par des contraintes de la forme « must-link » et « cannot-link ». De telles contraintes apparaissent fréquemment dans divers pro-blèmes, comme la résolution de la coréférence en traitement automatique du langage naturel. L'approche développée dans ce papier consiste à ap-prendre une nouvelle représentation de l'espace pour les données, ainsi qu'une nouvelle distance dans cet espace. Cette représentation est ob-tenue via une transformation linéaire de l'enveloppe spectrale des don-nées. Les contraintes sont exprimées avec des fonctions Gaussiennes qui réajustent localement les similarités entre les objets. Un problème d'op-timisation global et non convexe est alors obtenu et l'apprentissage du modèle se fait grâce à des techniques de descentes de gradient. Nous évaluons notre algorithme sur des jeux de données standards et le com-parons à divers algorithmes de l'état de l'art, comme [14,18,32]. Les ré-sultats sur ces jeux de données, ainsi que sur le jeu de données de la tâche de coréférence CoNLL-2012, montrent que notre algorithme amé-liore significativement la qualité des clusters obtenus par les précédentes approches, et est plus robuste en montée en charge.
Document type :
Conference papers
Complete list of metadatas

https://hal.inria.fr/hal-01105339
Contributor : Team Magnet <>
Submitted on : Tuesday, January 20, 2015 - 10:53:43 AM
Last modification on : Thursday, February 21, 2019 - 10:52:55 AM
Long-term archiving on : Tuesday, April 21, 2015 - 10:26:00 AM

File

fgpwc.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01105339, version 1

Citation

David Chatel, Pascal Denis, Marc Tommasi. Clustering Spectral avec Contraintes de Paires réglées par Noyaux Gaussiens. CAP 2014, Jul 2014, Saint-Etienne, France. ⟨hal-01105339⟩

Share

Metrics

Record views

249

Files downloads

165