Annotation d'entités cliniques en utilisant les Larges Modèles de Langue

Simon Meoni; Théo Ryffel; Eric De La Clergerie

Communication Dans Un Congrès Année : 2023

Annotation d'entités cliniques en utilisant les Larges Modèles de Langue

(1) , (2) , (1)

1
2

Simon Meoni

Fonction : Auteur
PersonId : 1262352

Automatic Language Modelling and ANAlysis & Computational Humanities

Théo Ryffel

Fonction : Auteur
PersonId : 1262353

Arkhn

Eric De La Clergerie

Fonction : Auteur
PersonId : 1179
IdHAL : eric-villemonte-de-la-clergerie

Automatic Language Modelling and ANAlysis & Computational Humanities

Résumé

Dans le domaine clinique et dans d'autres domaines spécialisés, les données sont rares du fait de leur caractère confidentiel. Ce manque de données est un problème majeur lors du fine-tuning de modèles de langue.Par ailleurs, les modèles de langue de très grande taille (LLM) ont des performances prometteuses dans le domaine médical. Néanmoins, ils ne peuvent pas être utilisés directement dans les infrastructures des établissements de santé pour des raisons de confidentialité des données. Nous explorons une approche d'annotation des données d'entraînement avec des LLMs pour entraîner des modèles de moins grandes tailles mieux adaptés à notre problématique. Cette méthode donne des résultats prometteurs pour des tâches d'extraction d'information

Mots clés

Supervision Faible Modèle de langue Large Extraction d'information TAL dans le domaine clinique

Domaines

Informatique et langage [cs.CL]

Fichier principal

479291.pdf (312.82 Ko)

Origine : Fichiers éditeurs autorisés sur une archive ouverte

Yannick Parmentier : Connectez-vous pour contacter le contributeur

https://hal.science/hal-04130197

Soumis le : mardi 20 juin 2023-15:32:42

Dernière modification le : mercredi 6 décembre 2023-10:38:22

Dates et versions

hal-04130197 , version 1 (20-06-2023)

Licence

Paternité

Identifiants

HAL Id : hal-04130197 , version 1

Citer

Simon Meoni, Théo Ryffel, Eric De La Clergerie. Annotation d'entités cliniques en utilisant les Larges Modèles de Langue. 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2023, Paris, France. pp.190-203. ⟨hal-04130197⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INRIA INRIA2 TALN-RECITAL

76 Consultations

25 Téléchargements

Annotation d'entités cliniques en utilisant les Larges Modèles de Langue

Résumé

Mots clés

Domaines

Dates et versions

Licence

Identifiants

Citer

Exporter

Collections

Partager