Réalisation d'un annuaire de sources de données génomiques en vue de la collecte et de l'intégration de données sur le Web

Shazia Osman 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : La génomique est un domaine qui a mûri à une vitesse étonnante durant cette dernière décennie. L'émergence de technologies biologiques à ‘haut débit' dans l'ère post-génomique a donné lieu à de vastes quantités de données de natures complexes et hétérogènes. En conséquence, des sources de données Web ont été créées pour rassembler ces informations. Cependant, ces sources sont elles-mêmes hétérogènes et dispersées. De ce fait, les biologistes se retrouvent toujours confrontés avec le problème de recherche d'informations afin d'améliorer et d'accélérer leur recherche. Le développement d'outils bio-informatiques est donc nécessaire pour assister le biologiste dans sa recherche. Le projet ‘BioRegistry', présenté dans ce rapport, vise à traiter ce problème dans le but de créer un annuaire de sources de données génomiques. En conséquence, un modèle doit être créé pour permettre la construction de ce type d'annuaire. Dans un premier temps, des méta-données pertinentes associées aux sources génomiques ont été identifiées et collectées. Celles-ci ont ensuite été organisées et classifiées selon des ontologies de domaine afin de s'occuper de la dimension sémantique de l'information, avant d'être injectées dans l'annuaire. Une fois ce dernier achevé, l'annuaire créé a été exploité de deux façons : d'une part pour visualiser ses contenus et d'autre part, pour extraire les informations pertinentes associées aux sources. Cette dernière étape sera éventuellement utilisée pour permettre la classification et l'interrogation de ‘BioRegistry'. || Genomics as a field has matured at an astonishing pace over the last decade. Moreover, the emergence of high throughput biological technologies in the post genomic era has given rise to a huge amount of complex and heterogenous genomic data. As a result,
Type de document :
Rapport
[Stage] A04-R-545 || osman04a, 2004, 77 p
Liste complète des métadonnées

https://hal.inria.fr/inria-00099853
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 09:51:20
Dernière modification le : jeudi 11 janvier 2018 - 06:19:55
Document(s) archivé(s) le : vendredi 25 novembre 2016 - 11:44:19

Fichiers

Identifiants

  • HAL Id : inria-00099853, version 1

Collections

Citation

Shazia Osman. Réalisation d'un annuaire de sources de données génomiques en vue de la collecte et de l'intégration de données sur le Web. [Stage] A04-R-545 || osman04a, 2004, 77 p. 〈inria-00099853〉

Partager

Métriques

Consultations de la notice

198

Téléchargements de fichiers

83