Cross-Model Queries and Schemas: Complexity and Learning

Radu Ciucanu 1, 2
1 LINKS - Linking Dynamic Data
Inria Lille - Nord Europe, CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189
Résumé : La spécification de requêtes est généralement une tâche difficile pour les utilisateurs non-experts. Le problème devient encore plus difficile quand les utilisateurs ont besoin d'interroger des bases de données de grande taille et donc difficiles à visualiser. Le schéma pourrait aider à cette spécification, mais celui-ci manque souvent ou est incomplet quand les données viennent de sources hétérogènes. Dans cette thèse, nous abordons le problème de la spécification de requêtes pour les utilisateurs non-experts. Nous identifions deux approches pour attaquer ce problème : apprendre les requêtes à partir d'exemples ou transformer les données dans un format plus facilement interrogeable par l'utilisateur. Nos contributions suivent ces deux directions et concernent trois modèles de données parmi les plus populaires : XML, relationnel et orienté graphe. Cette thèse comprend deux parties, consacrées à (i) la définition et la transformation de schémas, et (ii) l'apprentissage de schémas et de requêtes. Dans la première partie, nous définissons des formalismes de schémas pour les documents XML non-ordonnés et nous analysons leurs propriétés computationnelles; nous étudions également la complexité du problème d'échange de données entre une source relationnelle et une cible orientée graphe. Dans la deuxième partie, nous étudions le problème de l'apprentissage à partir d'exemples pour les schémas XML proposés dans la première partie, ainsi que pour les requêtes de jointures relationnelles et les requêtes de chemins sur les graphes. Nous proposons notamment un scénario interactif qui permet d'aider des utilisateurs non-experts à définir des requêtes dans ces deux classes.
Type de document :
Thèse
Databases [cs.DB]. Université Lille 1 - Sciences et Technologies, 2015. English
Liste complète des métadonnées


https://hal.inria.fr/tel-01182649
Contributeur : Radu Ciucanu <>
Soumis le : samedi 1 août 2015 - 18:12:19
Dernière modification le : vendredi 15 janvier 2016 - 18:48:57
Document(s) archivé(s) le : lundi 2 novembre 2015 - 10:14:14

Fichier

Identifiants

  • HAL Id : tel-01182649, version 1

Citation

Radu Ciucanu. Cross-Model Queries and Schemas: Complexity and Learning. Databases [cs.DB]. Université Lille 1 - Sciences et Technologies, 2015. English. <tel-01182649>

Partager

Métriques

Consultations de
la notice

511

Téléchargements du document

208