Modèle de classification et distance dans le cas continue - Inria - Institut national de recherche en sciences et technologies du numérique Access content directly
Reports (Research Report) Year : 1989

Modèle de classification et distance dans le cas continue

Abstract

Les méthodes de classification se ramènent souvent à l'optimisation d'un critère numérique défini à partir d'une distance. Dans certain cas, il est possible de montrer que cela revient à estimer les paramètres d'un modèle probabiliste par une approche classification. Ainsi, il est bien connu que le critère d'inertie, très souvent utilisé en classification, correspond à l'hypothèse d'une population issue d'un mélange de lois gaussiennes. Dans ce travail, nous étudions les liens qui existent entre ces deux approches lorsque les variables sont quantitatives. Pour ceci, nous définissons la notion de critère métrique et de critère probabiliste, nous montrons ensuite qu'un critère probabiliste peut toujours être considéré comme un critère métrique et établissons enfin les conditions pour que la réciproque soit vraie. Ces résultats sont alors appliqués à deux familles de critères métriques : les premiers sont définis à partir des distances quadratiques, les seconds, à partir de la distance L1. Cette approche permet de préciser en particulier les différences entre la méthode des distances adaptatives et la méthode de reconnaissance de mélange dans le cas gaussien et de montrer que les critères utilisant la distance en valeur absolue correspondent à un mélange de lois exponentielles bilatérales.
Fichier principal
Vignette du fichier
RR-0988.pdf (872.98 Ko) Télécharger le fichier

Dates and versions

inria-00075571 , version 1 (24-05-2006)

Identifiers

  • HAL Id : inria-00075571 , version 1

Cite

Gérard Govaert. Modèle de classification et distance dans le cas continue. [Rapport de recherche] RR-0988, INRIA. 1989, pp.15. ⟨inria-00075571⟩
76 View
58 Download

Share

Gmail Facebook X LinkedIn More