inria-00079378, version 1
Annotation sémantique de pages web
Sylvain Tenier
1, 2Amedeo Napoli 1Xavier Polanco 2Yannick Toussaint 1
6èmes journées francophones "Extraction et Gestion de Connaissances" - EGC 2006 1/RNTI-E-6 (2006) 305--310
Résumé : Cet article présente un système automatique d'annotation sémantique de pages web. Les systèmes d'annotation automatique existants sont essentiellement syntaxiques, même lorsque les travaux visent à produire une annotation sémantique. La prise en compte d'informations sémantiques sur le domaine pour l'annotation d'un élément dans une page web à partir d'une ontologie suppose d'aborder conjointement deux problèmes : (1) l'identification de la structure syntaxique caractérisant cet élément dans la page web et (2) l'identification du concept le plus spécifique (en termes de subsumption) dans l'ontologie dont l'instance sera utilisée pour annoter cet élément. Notre démarche repose sur la mise en oeuvre d'une technique d'apprentissage issue initialement des wrappers que nous avons articulée avec des raisonnements exploitant la structure formelle de l'ontologie.
- 1 : ORPAILLEUR (INRIA Lorraine - LORIA)
- INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
- 2 : Institut de l'information scientifique et technique (INIST)
- CNRS : UPS76
- Domaine : Informatique/Recherche d'information
- Mots-clés : annotation sémantique – représentation des connaissances – web sémantique
- inria-00079378, version 1
- http://hal.inria.fr/inria-00079378
- oai:hal.inria.fr:inria-00079378
- Contributeur : Sylvain Tenier
- Soumis le : Lundi 12 Juin 2006, 15:15:29
- Dernière modification le : Vendredi 26 Septembre 2008, 15:06:20






Documents associés
Exporter