Interactive Knowledge Discovery over Web of Data.

Mehwish Alam 1
1 ORPAILLEUR - Knowledge representation, reasonning
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Récemment, le `` Web des documents '' est devenu le `` Web des données '', \textit{i.e}, les documents sont annotés sous forme de triplets RDF. Ceci permet de transformer des données traitables uniquement par les humains en données compréhensibles par les machines. Ces données peuvent désormais être explorées par l'utilisateur par le biais de requêtes SPARQL. Par analogie avec les moteurs de clustering web qui fournissent des classifications des résultats obtenus à partir de l'interrogation du web des documents, il est également nécessaire de refléchir à un cadre qui permette la classification des réponses aux requêtes SPARQL pour donner un sens aux données retrouvées. \textit{La fouille exploratoire des données} se concentre sur l'établissement d'un aperçu de ces données. Elle permet également le filtrage des données non-intéressantes grâce à l'implication directe des experts du domaine dans le processus. La contribution de cette thèse consiste à guider l'utilisateur dans l'exploration du Web des données à l'aide de la fouille exploratoire de web des données. Nous étudions trois axes de recherche, i.e. : 1) la création des vues sur les graphes RDF et la facilitation des interactions de l'utilisateur sur ces vues, 2) l'évaluation de la qualité des données RDF et la complétion de ces données 3) la navigation et l'exploration simultanée de multiples ressources hétérogènes présentes sur le Web des données. Premièrement, nous introduisons un \emph{modificateur de solution} i.e., {\tt View By} pour créer des vues sur les graphes RDF et classer les réponses aux requêtes SPARQL à l'aide de l'analyse formelle des concepts. Afin de naviguer dans le treillis de concepts obtenu et d'extraire les unités de connaissance, nous avons développé un nouvel outil appelé RV-Explorer (\textit{RDF View Explorer}) qui met en oeuvre plusieurs modes de navigation. Toutefois, cette navigation/exploration révèle plusieurs incompletions dans les ensembles des données. Afin de compléter les données, nous utilisons l'extraction de règles d'association pour la complétion de données RDF. En outre, afin d'assurer la navigation et l'exploration directement sur les graphes RDF avec des connaissances de base, les triplets RDF sont groupés par rapport à cette connaissance de base et ces groupes peuvent alors être parcourus et explorés interactivement. Finallement, nous pouvons conclure que, au lieu de fournir l'exploration directe nous utilisons ACF comme un outil pour le regroupement de donnéees RDF. Cela permet de faciliter à l'utilisateur l'exploration des groupes de donnéees et de réduire ainsi son espace d'exploration par l'interaction.
Type de document :
Thèse
Information Retrieval [cs.IR]. Loria & Inria Grand Est, 2015. English
Liste complète des métadonnées

Littérature citée [150 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01245458
Contributeur : Mehwish Alam <>
Soumis le : mardi 5 janvier 2016 - 17:32:34
Dernière modification le : jeudi 11 janvier 2018 - 02:01:46

Identifiants

  • HAL Id : tel-01245458, version 2

Citation

Mehwish Alam. Interactive Knowledge Discovery over Web of Data.. Information Retrieval [cs.IR]. Loria & Inria Grand Est, 2015. English. 〈tel-01245458〉

Partager

Métriques

Consultations de la notice

372

Téléchargements de fichiers

392