Skip to Main content Skip to Navigation
Conference papers

Annotation sémantique de pages web

Sylvain Tenier 1, 2 Amedeo Napoli 1 Xavier Polanco 2 Yannick Toussaint 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cet article présente un système automatique d'annotation sémantique de pages web. Les systèmes d'annotation automatique existants sont essentiellement syntaxiques, même lorsque les travaux visent à produire une annotation sémantique. La prise en compte d'informations sémantiques sur le domaine pour l'annotation d'un élément dans une page web à partir d'une ontologie suppose d'aborder conjointement deux problèmes : (1) l'identification de la structure syntaxique caractérisant cet élément dans la page web et (2) l'identification du concept le plus spécifique (en termes de subsumption) dans l'ontologie dont l'instance sera utilisée pour annoter cet élément. Notre démarche repose sur la mise en oeuvre d'une technique d'apprentissage issue initialement des wrappers que nous avons articulée avec des raisonnements exploitant la structure formelle de l'ontologie.
Document type :
Conference papers
Complete list of metadata

https://hal.inria.fr/inria-00079378
Contributor : Sylvain Tenier <>
Submitted on : Monday, June 12, 2006 - 3:15:29 PM
Last modification on : Friday, March 12, 2021 - 2:34:34 PM
Long-term archiving on: : Monday, April 5, 2010 - 10:40:27 PM

Identifiers

  • HAL Id : inria-00079378, version 1

Collections

Citation

Sylvain Tenier, Amedeo Napoli, Xavier Polanco, Yannick Toussaint. Annotation sémantique de pages web. 6èmes journées francophones "Extraction et Gestion de Connaissances" - EGC 2006, Chabane Djeraba, LIFL, Université des Sciences et Technologies de Lille, Jan 2006, ENIC Telecom - USTL - Lille 1, France. pp.305--310. ⟨inria-00079378⟩

Share

Metrics

Record views

399

Files downloads

906