Conception of a semantic Web model applied to functional genomics - Archive ouverte HAL Access content directly
Theses Year : 2006

Conception of a semantic Web model applied to functional genomics

Conception d’un modèle Web sémantique appliqué à la génomique fonctionnelle

(1)
1
Fleur Mougin

Abstract

The general framework of this work is that of the Semantic Web and, more precisely, the application of Semantic Web technologies to functional genomics. The data biologists and physicians access for research purposes are typically available on the Internet. However, this information is also generally distributed over multiple autonomous, heterogeneous sources. We propose a mediator-based approach to integrating biomedical information sources. Our system provides a unique interface for biologists and physicians to access data sources in a centralized and homogeneous way. The use of a mediator is not novel in biomedicine. But existing systems have limitations in terms of conception and evolution, in particular, the need for manual intervention at many levels. To address these issues, we employed semi-automatic methods for creating a mediator-based system. First, we developed an automatic method for acquiring the schemas of the sources to be integrated. Then we used an existing terminological resource, the UMLS, to define a global schema. Finally, we proposed different approaches to mapping local schemas' elements to those of the global schema. These techniques operate at the schema and instance levels and are fully automated. Domain experts can also validate the integration process. The system we created is operational and available on the Internet. The information queried by the system is automatically integrated from multiple sources. Query processing expands users' queries by exploiting a hierarchy of relevant concepts and provides users with the values of the sources elements associated with these concepts. The system can be managed semi-automatically, as its evolution is facilitated by the methods developed for its conception.
Ce travail de thèse s'inscrit dans la problématique du Web sémantique et plus précisément l'utilisation de ses technologies dans le domaine de la génomique fonctionnelle. Au cours de leurs travaux de recherche, les biologistes et médecins doivent disposer de données concernant l'existant et ces informations sont généralement accessibles sur Internet. Le problème est qu'elles sont réparties dans des sources distribuées, autonomes et hétérogènes à de multiples niveaux. C'est dans ce cadre que nous proposons le développement d'un système d'intégration basée médiateur. Celui-ci vise à offrir aux biologistes et médecins une interface unique permettant d'accéder aux différentes sources de manière centralisée et homogène. Des systèmes suivant cette approche existent dans la littérature mais présentent des limites en terme de conception et d'évolution. En effet, de nombreuses tâches restent manuelles, ce qui les rend particulièrement fastidieuses. Pour répondre à ces limites, nous avons conçu un système médiateur au moyen de méthodes semi-automatiques. Tout d'abord, nous avons développé une méthode d'acquisition automatique des schémas des sources de données à intégrer. Ensuite, nous avons utilisé une ressource terminologique existante, l'UMLS, afin de définir un schéma global. Enfin, nous avons proposé différentes approches pour mettre en correspondance les éléments des schémas locaux avec ceux du schéma global. Celles-ci sont situées aux niveaux schéma et instances et sont automatiques, avec une possible validation manuelle par des experts. Le système implémenté à partir de ces méthodes est opérationnel et accessible sur Internet et permet de traiter des requêtes simples qui impliquent plusieurs sources de données. Le processus de requêtes effectue une expansion de celles-ci en exploitant la hiérarchie des concepts identifiés comme pertinents, et rend finalement aux utilisateurs les valeurs des éléments des sources associés à ces concepts. La maintenance du système est facilitée par les méthodes développées pour sa conception, permettant ainsi de la gérer de manière semi-automatique.
Fichier principal
Vignette du fichier
these_fm.pdf (10.09 Mo) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

tel-02402050 , version 1 (10-12-2019)

Identifiers

  • HAL Id : tel-02402050 , version 1

Cite

Fleur Mougin. Conception d’un modèle Web sémantique appliqué à la génomique fonctionnelle. Bio-informatique [q-bio.QM]. Université de Rennes 1, 2006. Français. ⟨NNT : ⟩. ⟨tel-02402050⟩
70 View
319 Download

Share

Gmail Facebook Twitter LinkedIn More