Une mesure de similarité sémantique pour la classification de documents par le contenu

Rim Al Hulou; Amedeo Napoli; Emmanuel Nauer

Article Dans Une Revue Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information Année : 2004

Une mesure de similarité sémantique pour la classification de documents par le contenu

(1) , (1) , (1)

Rim Al Hulou

Fonction : Auteur
PersonId : 831790

Knowledge representation, reasonning

Amedeo Napoli

Fonction : Auteur
PersonId : 743383
IdHAL : amedeo-napoli
IdRef : 034282297

Knowledge representation, reasonning

Emmanuel Nauer

Fonction : Auteur
PersonId : 175403
IdHAL : emmanuel-nauer
ORCID : 0000-0001-5756-0031
IdRef : 152295399

Knowledge representation, reasonning

Résumé

Dans cet article, nous proposons une approche pour classifier des documents textuels à partir de leur contenu. Le contenu des documents est exprimé par des annotations représentées sous forme d'arbres. Étant donnée une hiérarchie d'annotations génériques, notre approche vise à rattacher une annotation spécifique à une ou plusieurs classes possibles dans la hiérarchie. Ce processus de classification repose sur une mesure de similarité qui permet de mesurer l'écart entre une annotation spécifique et une annotation générique. Un schéma d'algorithme de classification de documents est proposé à partir de cette mesure de similarité.

Mots clés

similarité sémantique semantic similarity classification reasoning ontologies raisonnement annotation

Domaines

Autre [cs.OH]

Publications Loria : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00100248

Soumis le : mardi 10 octobre 2006-17:18:00

Dernière modification le : dimanche 30 juillet 2023-14:43:15

Dates et versions

inria-00100248 , version 1 (10-10-2006)

Identifiants

HAL Id : inria-00100248 , version 1

Citer

Rim Al Hulou, Amedeo Napoli, Emmanuel Nauer. Une mesure de similarité sémantique pour la classification de documents par le contenu. Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information, 2004, Numéro spécial L'objet, 10 (2--3), pp.217--230. ⟨inria-00100248⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE INRIA2 LORIA

127 Consultations

0 Téléchargements

Une mesure de similarité sémantique pour la classification de documents par le contenu

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager