La qualité des données comme condition à la qualité des connaissances : un état de l'art - Archive ouverte HAL Access content directly
Journal Articles Revue des Nouvelles Technologies de l'Information Year : 2004

La qualité des données comme condition à la qualité des connaissances : un état de l'art

(1)
1

Abstract

Les travaux actuels sur l'extraction de connaissances à partir des données (ECD) se focalisent sur la recherche de règles intéressantes dont on souhaite pouvoir qualifier l'intérêt ou le caractère exceptionnel, mais dont la validité dépend bien évidemment de celle des données. En amont du processus d'ECD, il semble donc essentiel d'évaluer la qualité des données stockées dans les bases et entrepôts de données afin de : (1) proposer aux utilisateurs une expertise critique de la qualité du contenu d'un système, (2) orienter l'extraction des connaissances en fonction d'un profil ciblé d'utilisateurs et de décideurs, (3) permettre à ceux-ci de relativiser la confiance qu'ils pourraient accorder aux données et aux règles extraites, et leur permettre ainsi de mieux en adapter leur usage, (4) assurer enfin la validité et l'intérêt des connaissances extraites à partir des données. Cet article fait une synthèse de l'état de l'art dans le domaine de la qualité des données en présentant, dans un premier temps, les causes de la non-qualité des données, puis en décrivant un panorama des travaux sur la qualité des données, travaux pertinents dès lors que l'on s'intéresse à modéliser, mesurer et à améliorer la qualité des connaissances "élaborées" à partir des données. Enfin, l'article propose d'exploiter les méta-données décrivant la qualité des données dans le processus d'ECD.
Fichier principal
Vignette du fichier
1000108.pdf (266.95 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-01856198 , version 1 (10-08-2018)

Identifiers

  • HAL Id : hal-01856198 , version 1

Cite

Laure Berti-Équille. La qualité des données comme condition à la qualité des connaissances : un état de l'art. Revue des Nouvelles Technologies de l'Information, 2004, Numéro spécial “Mesures de qualité pour la fouille de données”. ⟨hal-01856198⟩
280 View
1102 Download

Share

Gmail Facebook Twitter LinkedIn More