The ViP2P Platform: XML Views in P2P - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2011

The ViP2P Platform: XML Views in P2P

Résumé

The growing volumes of XML data sources on the Web or produced by enterprises, organizations etc. raise many performance challenges for data management applications. In this work, we are concerned with the distributed, peer-to-peer management of large corpora of XML documents, based on distributed hash table (or DHT, in short) overlay networks. We present ViP2P (standing for Views in Peer-to-Peer), a distributed platform for sharing XML documents based on a structured P2P network infrastructure (DHT). At the core of ViP2P stand distributed materialized XML views, defined by arbitrary XML queries, filled in with data published anywhere in the network, and exploited to efficiently answer queries issued by any network peer. ViP2P allows user queries to be evaluated over XML documents published by peers in two modes. First, a long-running subscription mode, when a query can be registered in the system and receive answers incrementally when and if published data matches the query. Second, queries can also be asked in an ad-hoc, snapshot mode, where results are required immediately and must be computed based on the results of other long-running, subscription queries. ViP2P innovates over other similar DHT-based XML sharing platforms by using a very expressive structured XML query language. This expressivity leads to a very flexible distribution of XML content in the ViP2P network, and to efficient snapshot query execution. ViP2P has been tested in real deployments of hundreds of computers. We present the platform architecture, its internal algorithms, and demonstrate its efficiency and scalability through a set of experiments. Our experimental results outgrow by orders of magnitude similar competitor systems in terms of data volumes, network size and data dissemination throughput.
Les grands volumes de données XML disponibles sur le Web, produites par les organisations ou individus posent des défis importants pour la gestion efficace de données. Ce travail est situé dans le contexte de la gestion de grands volumes de documents XML, dans un réseau décentralisé, distribué, pair-à-pair, qui s'appuye sur une table de hashage distribuée (ou DHT). Dans ce rapport, nous présentons ViP2P (vues en pair-à-pair), une plateforme distribuée pour le partage de documents XML s'appuyant sur un réseau de type DHT. Au cœur de ViP2P sont des vues matérialisées distribuées. Celles-ci sont définies par n'importe quel pair, sous la forme de requêtes XML. Dès que des données XML publiées par un pair quelconque correspondent aux définitions des vues, ces données seront utilisées pour contribuer au contenu des vues. ViP2P fournit deux scénarios d'évaluation de requêtes sur des documents XML. Il existe d'abord un mode "souscription", où une requête enregistréee dans le système reçoit des réponses de façon incrémentale, lorsque des données que l'on vient de publier contribuent aux résultats. En deuxième lieu, une requêtes peut être évaluée uniquement à partir des données déjà publiées, en réécrivant la requête à l'aide des vues matérialisées. Nous avons testé ViP2P déployé dans des réseaux distribués de plusieurs centaines d'ordinateurs. Dans ce rapport, nous présentons son architecture, ses principaux algorithmes, et démontrons son efficacité et son passage à l'échelle par une série d'expériences. Les résultats de nos mesures démontrent la robustesse de ViP2P jusqu'à des volumes de données, débit de dissemination de données, et tailles de réseau, allant au delà (jusqu'à plusieurs ordres de grandeurs) des mesures précédemment publiées sur des systèmes comparables.
Fichier principal
Vignette du fichier
RR-7812.pdf (1.2 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00644679 , version 1 (24-11-2011)
hal-00644679 , version 2 (12-12-2011)
hal-00644679 , version 3 (12-12-2011)

Identifiants

  • HAL Id : hal-00644679 , version 2

Citer

Konstantinos Karanasos, Asterios Katsifodimos, Ioana Manolescu, Spyros Zoupanos. The ViP2P Platform: XML Views in P2P. [Research Report] RR-7812, 2011, pp.41. ⟨hal-00644679v2⟩

Collections

INRIA-RRRT
237 Consultations
308 Téléchargements

Partager

Gmail Facebook X LinkedIn More