Annotation sémantique de pages web - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Annotation sémantique de pages web

Résumé

Cet article présente un système automatique d'annotation sémantique de pages web. Les systèmes d'annotation automatique existants sont essentiellement syntaxiques, même lorsque les travaux visent à produire une annotation sémantique. La prise en compte d'informations sémantiques sur le domaine pour l'annotation d'un élément dans une page web à partir d'une ontologie suppose d'aborder conjointement deux problèmes : (1) l'identification de la structure syntaxique caractérisant cet élément dans la page web et (2) l'identification du concept le plus spécifique (en termes de subsumption) dans l'ontologie dont l'instance sera utilisée pour annoter cet élément. Notre démarche repose sur la mise en oeuvre d'une technique d'apprentissage issue initialement des wrappers que nous avons articulée avec des raisonnements exploitant la structure formelle de l'ontologie.
Fichier principal
Vignette du fichier
egcfinal.pdf (201.49 Ko) Télécharger le fichier

Dates et versions

inria-00079378 , version 1 (12-06-2006)

Licence

Paternité

Identifiants

  • HAL Id : inria-00079378 , version 1

Citer

Sylvain Tenier, Amedeo Napoli, Xavier Polanco, Yannick Toussaint. Annotation sémantique de pages web. 6èmes journées francophones "Extraction et Gestion de Connaissances" - EGC 2006, Chabane Djeraba; Université des Sciences et Technologies de Lille; LIFL, Jan 2006, Lille, France. pp.305-310. ⟨inria-00079378⟩
198 Consultations
525 Téléchargements

Partager

Gmail Facebook X LinkedIn More