Symbolic Inference Methods for Databases

Slawomir Staworko 1, 2
1 LINKS - Linking Dynamic Data
Inria Lille - Nord Europe, CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189
Résumé : Ce mémoire est une courte présentation d’une direction de recherche, à laquelle j’ai activement participé, sur l’apprentissage pour les bases de données à partir d’exemples. Cette recherche s’est concentrée sur les modèles et les langages, aussi bien traditionnels qu’émergents, pour l’interrogation, la transformation et la description du schéma d’une base de données. Concernant les schémas, nos contributions consistent en plusieurs langages de schémas pour les nouveau modèles de bases de données que sont XML non-ordonné et RDF. Nous avons ainsi étudié l’apprentissage à partir d’exemples des schémas pour XML non-ordonné, des schémas pour RDF, des requêtes twig pour XML, les requêtes de jointure pour bases de données relationnelles et les transformations XML définies par un nouveau modèle de transducteurs arbre-à-mot. Pour explorer si les langages proposés peuvent être appris, nous avons été obligés d’examiner de près un certain nombre de leurs propriétés fondamentales, souvent souvent intéressantes par elles-mêmes, y compris les formes normales, la minimisation, l’inclusion et l’équivalence, la cohérence d’un ensemble d’exemples et la caractérisation finie. Une bonne compréhension de ces propriétés nous a permis de concevoir des algorithmes d’apprentissage qui explorent un espace de recherche potentiellement très vaste grâce à un ensemble d’opérations de généralisation adapté à la recherche d’une solution appropriée. L’apprentissage (ou l’inférence) est un problème à deux paramètres : la classe précise de langage que nous souhaitons inférer et le type d’informations que l’utilisateur peut fournir. Nous nous sommes placés dans le cas où l’utilisateur fournit des exemples positifs, c’est-à-dire des éléments qui appartiennent au langage cible, ainsi que des exemples négatifs, c’est-à-dire qui n’en font pas partie. En général l’utilisation à la fois d’exemples positifs et négatifs permet d’apprendre des classes de langages plus riches que l’utilisation uniquement d’exemples positifs. Toutefois, l’utilisation des exemples négatifs est souvent difficile parce que les exemples positifs et négatifs peuvent rendre la forme de l’espace de recherche très complexe, et par conséquent, son exploration infaisable.
Type de document :
HDR
Databases [cs.DB]. Université de Lille, 2015
Liste complète des métadonnées

Littérature citée [103 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01254965
Contributeur : Slawomir Staworko <>
Soumis le : mercredi 13 janvier 2016 - 01:13:11
Dernière modification le : mercredi 25 avril 2018 - 15:42:52
Document(s) archivé(s) le : vendredi 11 novembre 2016 - 03:34:51

Fichier

Identifiants

  • HAL Id : tel-01254965, version 1

Collections

Citation

Slawomir Staworko. Symbolic Inference Methods for Databases. Databases [cs.DB]. Université de Lille, 2015. 〈tel-01254965〉

Partager

Métriques

Consultations de la notice

301

Téléchargements de fichiers

137