Étendre un système de gestion de provenance : ProvSQL - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Mémoires D'étudiants -- Hal-Inria+ Année : 2023

Étendre un système de gestion de provenance : ProvSQL

Résumé

In a context where the increasing use of data poses major challenges in terms of reliability and traceability, managing data provenance has become crucial. Data provenance refers to the history and associated information of data collection, transformation, and storage, allowing for the assessment of their validity and ensuring their integrity. This project focuses on integrating data provenance management into temporal databases. Temporal databases are specifically designed to handle data evolving over time, thus providing the ability to contextualize the validity of collected and stored information. Our contribution consists of an innovative solution based on the use of semirings to calculate data validity times in temporal databases. This solution will be integrated into ProvSQL, an extension dedicated to managing provenance and probability in PostgreSQL. The main goal is to enhance the understanding of the history associated with temporal data, thereby ensuring their traceability and reliability. Furthermore, we are implementing an optimization and performance evaluation approach within ProvSQL. We aim to reduce the computation time for provenance and improve the overall efficiency of the system. In summary, this project proposes the integration of data provenance management into temporal databases by extending ProvSQL with a semiring-based solution. This approach strengthens data traceability and reliability while optimizing the performance of ProvSQL.
Dans un contexte où l’utilisation croissante des données pose des défis majeurs en termes de fiabilité et de traçabilité, la gestion de la provenance des données est devenue cruciale. La provenance des données fait référence à l’historique et aux informations associées à leur collecte, leur transformation et leur stockage, ce qui permet d’évaluer leur validité et de garantir leur intégrité. Ce projet se concentre sur l’intégration de la gestion de la provenance des données dans les bases de données temporelles. Les bases de données temporelles sont spécialement conçues pour gérer des données évoluant dans le temps, offrant ainsi la possibilité de contextualiser la validité des informations collectées et stockées. Notre contribution consiste en une solution innovante reposant sur l’utilisation de semi-anneaux pour calculer les temps de validité des données dans les bases de données temporelles. Cette solution sera intégrée à ProvSQL, une extension dédiée à la gestion de la provenance et de la probabilité dans PostgreSQL. L’objectif principal est d’améliorer la compréhension de l’historique associé aux données temporelles, assurant ainsi leur traçabilité et leur fiabilité. En outre, nous mettons en place une démarche d’optimisation et d’évaluation des performances au sein de ProvSQL. Nous cherchons à réduire le temps de calcul de la provenance et à améliorer l’efficacité globale du système. En résumé, ce projet propose une intégration de la gestion de la provenance des données dans les bases de données temporelles en étendant ProvSQL avec une solution basée sur les semi-anneaux. Cette approche renforce la traçabilité et la fiabilité des données tout en optimisant les performances de ProvSQL.
Fichier principal
Vignette du fichier
BelkisDJEFFAL_Rapport_de_projet_de_fin_d_études.pdf (1.56 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04342025 , version 1 (13-12-2023)

Licence

Paternité

Identifiants

  • HAL Id : hal-04342025 , version 1

Citer

Belkis Djeffal. Étendre un système de gestion de provenance : ProvSQL. Informatique [cs]. 2023. ⟨hal-04342025⟩
23 Consultations
12 Téléchargements

Partager

Gmail Facebook X LinkedIn More