Contributions à l'extraction de connaissances à partir de données biologiques

Malika Smaïl-Tabbone 1
1 ORPAILLEUR - Knowledge representation, reasonning
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : La maîtrise et l'exploitation des données biologiques constituent un enjeu majeur de la biologie contemporaine. En effet, les techniques à haut débit ont conduit à une multiplication de bases de données qui servent à structurer et à entreposer les résultats des expériences mais aussi de programmes chargés de traiter ces données et d'en produire des nouvelles. Ces gisements de données sont disponibles au plus grand nombre et les biologistes ont d'énormes espoirs quant à l’extraction de connaissances qui leur permettront de résoudre divers problèmes tels que l'identification de gènes responsables de maladies ou la caractérisation de médicaments du point de vue de leurs effets indésirables. Je propose des solutions méthodologiques et pragmatiques afin de faciliter cette analyse réputée difficile en raison de l’hétérogénéité des données. Ces solutions s’appuient sur le processus itératif d'Extraction de Connaissances à partir de Données (ECD) avec deux contraintes : l'exploitation des connaissances du domaine et la fouille de données relationnelles. Nos contributions peuvent être résumées selon les trois étapes de l’ECD : (1) Découverte de ressources et intégration de données dirigée par un modèle de domaine, (2) Fouille de données complexes pour découvrir notamment des règles grâce à la programmation logique inductive, (3) Aide à l'interprétation des modèles trouvés en permettant la structuration et la persistance des résultats de la fouille. Le dernier point est cohérent avec le cadre conceptuel des bases de données inductives et nous avons montré comment, sur des problèmes du monde réel, cela facilite les itérations du processus d'ECD
Liste complète des métadonnées

https://hal.inria.fr/tel-01093943
Contributeur : Malika Smail-Tabbone <>
Soumis le : vendredi 23 janvier 2015 - 14:15:32
Dernière modification le : jeudi 11 janvier 2018 - 06:25:24
Document(s) archivé(s) le : samedi 15 avril 2017 - 20:31:09

Identifiants

  • HAL Id : tel-01093943, version 2

Collections

Citation

Malika Smaïl-Tabbone. Contributions à l'extraction de connaissances à partir de données biologiques. Apprentissage [cs.LG]. Université de Lorraine, 2014. 〈tel-01093943v2〉

Partager

Métriques

Consultations de la notice

1094

Téléchargements de fichiers

223