Réalisation d'un annuaire de sources de données génomiques en vue de la collecte et de l'intégration de données sur le Web - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport Année : 2004

Réalisation d'un annuaire de sources de données génomiques en vue de la collecte et de l'intégration de données sur le Web

Résumé

La génomique est un domaine qui a mûri à une vitesse étonnante durant cette dernière décennie. L'émergence de technologies biologiques à ‘haut débit' dans l'ère post-génomique a donné lieu à de vastes quantités de données de natures complexes et hétérogènes. En conséquence, des sources de données Web ont été créées pour rassembler ces informations. Cependant, ces sources sont elles-mêmes hétérogènes et dispersées. De ce fait, les biologistes se retrouvent toujours confrontés avec le problème de recherche d'informations afin d'améliorer et d'accélérer leur recherche. Le développement d'outils bio-informatiques est donc nécessaire pour assister le biologiste dans sa recherche. Le projet ‘BioRegistry', présenté dans ce rapport, vise à traiter ce problème dans le but de créer un annuaire de sources de données génomiques. En conséquence, un modèle doit être créé pour permettre la construction de ce type d'annuaire. Dans un premier temps, des méta-données pertinentes associées aux sources génomiques ont été identifiées et collectées. Celles-ci ont ensuite été organisées et classifiées selon des ontologies de domaine afin de s'occuper de la dimension sémantique de l'information, avant d'être injectées dans l'annuaire. Une fois ce dernier achevé, l'annuaire créé a été exploité de deux façons : d'une part pour visualiser ses contenus et d'autre part, pour extraire les informations pertinentes associées aux sources. Cette dernière étape sera éventuellement utilisée pour permettre la classification et l'interrogation de ‘BioRegistry'. || Genomics as a field has matured at an astonishing pace over the last decade. Moreover, the emergence of high throughput biological technologies in the post genomic era has given rise to a huge amount of complex and heterogenous genomic data. As a result,
Fichier principal
Vignette du fichier
A04-R-545.pdf (25.65 Mo) Télécharger le fichier

Dates et versions

inria-00099853 , version 1 (26-09-2006)

Identifiants

  • HAL Id : inria-00099853 , version 1

Citer

Shazia Osman. Réalisation d'un annuaire de sources de données génomiques en vue de la collecte et de l'intégration de données sur le Web. [Stage] A04-R-545 || osman04a, 2004, 77 p. ⟨inria-00099853⟩
130 Consultations
54 Téléchargements

Partager

Gmail Facebook X LinkedIn More