Champs Conditionnels Aléatoires pour l'Annotation d'Arbres

Résumé : Avec en vue la transformation de documents semi-structurés de type XML, nous nous intéressons au problème de l'annotation de tels documents par apprentissage statistique, à partir d'exemples de documents déjà annotés. Afin de modéliser la probabilité d'une annotation connaissant un document, nous nous plaçons dans le cadre des champs conditionnels aléatoires. Ce modèle a déjà fait ses preuves pour l'annotation de séquences : nous l'adaptons ici aux arbres ordonnés d'arité non bornée. Nous étudions l'expressivité du nouveau modèle ainsi introduit en le comparant aux automates d'arbres stochastiques (ou grammaires régulières probabilistes d'arbres). Nous présentons aussi en détail l'algorithme de recherche de l'annotation la plus probable et l'algorithme d'inférence pour ce modèle. Ces algorithmes sont implantés dans une librairie Tree CRF écrite en JAVA. Ces travaux sont des préliminaires qui nous permettront par la suite d'étudier les applications du modèle pour la transformation de documents.
Type de document :
Communication dans un congrès
CAp 2006, May 2006, Trégastel, France. 2006
Liste complète des métadonnées

Littérature citée [13 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00117014
Contributeur : Marc Tommasi <>
Soumis le : mercredi 29 novembre 2006 - 18:24:49
Dernière modification le : jeudi 11 janvier 2018 - 06:22:13
Document(s) archivé(s) le : mardi 6 avril 2010 - 19:12:39

Fichier

jousse.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00117014, version 1

Collections

Citation

Florent Jousse, Rémi Gilleron, Isabelle Tellier, Marc Tommasi. Champs Conditionnels Aléatoires pour l'Annotation d'Arbres. CAp 2006, May 2006, Trégastel, France. 2006. 〈inria-00117014〉

Partager

Métriques

Consultations de la notice

280

Téléchargements de fichiers

215