Scalable Query-based Faceted Search on top of SPARQL Endpoints for Guided and Expressive Semantic Search - Archive ouverte HAL Access content directly
Reports (Research Report) Year : 2013

Scalable Query-based Faceted Search on top of SPARQL Endpoints for Guided and Expressive Semantic Search

(1) , (1) , (1)
1
Joris Guyonvarch
  • Function : Author
  • PersonId : 946342
Sebastien Ferre
Mireille Ducassé

Abstract

Because the Web of Documents is composed of structured pages that are not meaningful to machines, search in the Web of Documents is generally processed by keywords. However, because the Web of Data provides structured information, search in the Web of Data can be more precise. SPARQL is the standard query language for querying this structured information. SPARQL is expressive and its syntax is similar to SQL. However, casual user can not write SPARQL queries. Sewelis is a search system for the Web of Data offering to explore data progressively and more user-friendly than SPARQL. Sewelis guides the search with a query built incrementally because users only have to select query elements in order to complete the query. However, Sewelis does not scale to large datasets such as DBpedia, which is composed of about 2 billion triples. In this report, we introduce Scalewelis. Scalewelis is a search system for the Web of Data that is similar to Sewelis but scalable. Moreover, Scalewelis is independent to data because it connects to SPARQL endpoints. We took part in a challenge on DBpedia with Scalewelis. We were able to answer to 70 questions out of 99 with acceptable response times.
Le Web de Documents est constitué de pages structurées mais difficilement compréhensibles par la machine, ainsi, la recherche dans le Web de Documents s'effectue généralement par mots-clés. Par ailleurs, le Web de Données structure non seulement les pages mais structure aussi l'information, ainsi, la recherche dans le Web de Données est plus précise. SPARQL est le langage standard pour interroger l'information dans le Web de Données. SPARQL est un langage expressif qui a une syntaxe proche de SQL. Cependant, les utilisateurs occasionnels ne sont pas capable d'écrire des requêtes en langage SPARQL. Sewelis permet comme SPARQL d'explorer l'information dans le Web de Données mais il est plus facile d'utilisation et propose une exploration progressive des données. Sewelis guide la recherche avec une requête construite progressivement parce que les utilisateurs la complète avec des bouts de requêtes qui lui sont proposés. Par contre, Sewelis ne fonctionne pas sur de gros jeux de donnée comme DBpedia, constitué de plus de 2 milliards de triplets. Dans ce rapport, nous présentons Scalewelis, un système de recherche pour le Web de Données à la manière de Sewelis à la différence près qu'il passe à l'échelle. Par ailleurs, Scalewelis est indépendant par rapport aux données parce qu'il est connecté à des points d'accès SPARQL. Nous avons testé Scalewelis au cours d'un challenge sur DBpedia. Nous avons pu répondre à 70 questions sur les 99 et, ce, avec des temps de réponses acceptables.
Fichier principal
Vignette du fichier
main.pdf (621.75 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-00868460 , version 1 (01-10-2013)

Identifiers

  • HAL Id : hal-00868460 , version 1

Cite

Joris Guyonvarch, Sebastien Ferre, Mireille Ducassé. Scalable Query-based Faceted Search on top of SPARQL Endpoints for Guided and Expressive Semantic Search. [Research Report] PI-2009, 2013, pp.28. ⟨hal-00868460⟩
390 View
239 Download

Share

Gmail Facebook Twitter LinkedIn More