inria-00117014, version 1
Champs Conditionnels Aléatoires pour l'Annotation d'Arbres
Florent Jousse
1, 2, 3Rémi Gilleron 1, 2, 3Isabelle Tellier 1, 2, 3Marc Tommasi
1, 2, 3
CAp 2006 (2006)
Résumé : Avec en vue la transformation de documents semi-structurés de type XML, nous nous intéressons au problème de l'annotation de tels documents par apprentissage statistique, à partir d'exemples de documents déjà annotés. Afin de modéliser la probabilité d'une annotation connaissant un document, nous nous plaçons dans le cadre des champs conditionnels aléatoires. Ce modèle a déjà fait ses preuves pour l'annotation de séquences : nous l'adaptons ici aux arbres ordonnés d'arité non bornée. Nous étudions l'expressivité du nouveau modèle ainsi introduit en le comparant aux automates d'arbres stochastiques (ou grammaires régulières probabilistes d'arbres). Nous présentons aussi en détail l'algorithme de recherche de l'annotation la plus probable et l'algorithme d'inférence pour ce modèle. Ces algorithmes sont implantés dans une librairie Tree CRF écrite en JAVA. Ces travaux sont des préliminaires qui nous permettront par la suite d'étudier les applications du modèle pour la transformation de documents.
- 1 : MOSTRARE (INRIA Futurs)
- INRIA – CNRS : UMR8022 – Université des Sciences et Technologies de Lille - Lille I : EA3588 – Université Charles de Gaulle - Lille III
- 2 : Laboratoire d'Informatique Fondamentale de Lille (LIFL)
- CNRS : UMR8022 – INRIA – IRCICA – Université des Sciences et Technologies de Lille - Lille I
- 3 : GRAPPA (LIFL)
- CNRS : UMR8022 – Université Charles de Gaulle - Lille III – Université des Sciences et Technologies de Lille - Lille I
- Domaine : Informatique/Apprentissage
Informatique/Web - Mots-clés : Données semi-structurées – Annotation – Modèles conditionnels – Champs conditionnels aléatoires
- inria-00117014, version 1
- http://hal.inria.fr/inria-00117014
- oai:hal.inria.fr:inria-00117014
- Contributeur : Marc Tommasi
- Soumis le : Mercredi 29 Novembre 2006, 18:24:49
- Dernière modification le : Lundi 14 Décembre 2009, 22:37:42






Documents associés
Exporter