Analyse morphologique en terminologie biomédicale par alignement et apprentissage non-supervisé

Vincent Claveau 1, * Ewa Kijak 1
* Auteur correspondant
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Dans le domaine biomédical, beaucoup de termes sont des composés savants (composés de plusieurs racines gréco-latines). L'étude de leur morphologie est importante pour de nombreuses applications puisqu'elle permet de structurer ces termes, de les rechercher efficacement, de les traduire... Dans cet article, nous proposons de suivre une démarche originale mais fructueuse pour mener cette analyse morphologique sur des termes simples en français, en nous appuyant sur une langue pivot, le japonais, et plus précisément sur les termes écrits en kanjis. Pour cela nous avons développé un algorithme d'alignement de termes spécialement adapté à cette tâche. C'est cet alignement d'un terme français avec sa traduction en kanjis qui fournit en même temps une décomposition en morphe et leur étiquetage par les kanjis correspondants. Évalué sur un jeu de données conséquent, notre approche obtient une précision supérieure à 70% et montrent son bien fondé en comparaison avec les techniques existantes. Nous illustrons également l'intérêt de notre démarche au travers de deux applications directes de ces alignements : la traduction de termes inconnus et la découverte de relations entre morphes pour la tructuration terminologique.
Type de document :
Communication dans un congrès
Conférence Traitement automatique des langues naturelles, TALN'10, Jul 2010, Montréal, Québec, Canada. 2010, 〈http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_83.pdf〉
Liste complète des métadonnées

https://hal.inria.fr/inria-00561086
Contributeur : Patrick Gros <>
Soumis le : lundi 31 janvier 2011 - 16:01:14
Dernière modification le : mercredi 16 mai 2018 - 11:23:05

Identifiants

  • HAL Id : inria-00561086, version 1

Citation

Vincent Claveau, Ewa Kijak. Analyse morphologique en terminologie biomédicale par alignement et apprentissage non-supervisé. Conférence Traitement automatique des langues naturelles, TALN'10, Jul 2010, Montréal, Québec, Canada. 2010, 〈http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_83.pdf〉. 〈inria-00561086〉

Partager

Métriques

Consultations de la notice

337