Partitioning Wide Area Graphs Using a Space Filling Curve - Archive ouverte HAL Access content directly
Journal Articles International Journal of Data Mining & Knowledge Management Process Year : 2021

Partitioning Wide Area Graphs Using a Space Filling Curve

Partitionnement de graphes large échelle à l'aide d'une courbe de remplissage

(1) , (1) , (2) , (1) , (1)
1
2

Abstract

Graph structure is a very powerful tool to model system and represent their actual shape. For instance, modelling an infrastructure or social network naturally leads to graph. Yet, graphs can be very different from one another as they do not share the same properties (size, connectivity, communities, etc.) and building a system able to manage graphs should take into account this diversity. A big challenge concerning graph management is to design a system providing a scalable persistent storage and allowing efficient browsing. Mainly to study social graphs, the most recent developments in graph partitioning research often consider scale-free graphs. As we are interested in modelling connected objects and their context, we focus on partitioning geometric graphs. Consequently our strategy differs, we consider geometry as our main partitioning tool. In fact, we rely on Inverse Space-filling Partitioning, a technique which relies on a space filling curve to partition a graph and was previously applied to graphs essentially generated from Meshes. Furthermore, we extend Inverse Space-Filling Partitioning toward a new target we define as Wide Area Graphs. We provide an extended comparison with two state-of-the-art graph partitioning streaming strategies, namely LDG and FENNEL. We also propose customized metrics to better understand and identify the use cases for which the ISP partitioning solution is best suited. Experimentations show that in favourable contexts, edge-cuts can be drastically reduced, going from more 34% using FENNEL to less than 1% using ISP.
Le concept de graphe permet de modéliser des systèmes variés en décrivant les interactions entre les éléments qui les composent. Par exemple, la modélisation d’une infrastructure réseau ou d’un réseau social peut se faire de façon naturelle via un graphe. Or les graphes sont très différents les uns des autres et ne partagent pas les mêmes caractéristiques (taille, connectivité, communautés, …). Les systèmes capables de gérer ces graphes doivent prendre en compte cette diversité. Un défi majeur concernant la gestion des graphes est de concevoir un système fournissant un stockage persistant capable de passer à l’échelle et de permettre une navigation efficace dans le graphe. En ciblant notamment les réseaux sociaux, des travaux récents ont été menés sur le thème du partitionnement de graphe dans le cas de graphes dits scale-free. Dans cet article, nous nous intéressons à la modélisation d’objets connectés et de leur environement. Nous adressons donc le problème du partitionnement dans le cas de graphes géométriques où chaque noeud du graphe possède une localisation géographique. Nous nous appuyons sur cette caractéristique pour étudier une solution de partitionnement inspirée de la technique « Inverse Space-Filling Partitioning (ISP)» qui repose sur l’utilisation d’une courbe de remplissage. Dans notre cas, nous n’appliquons pas cette technique à une structure de type Maillage mais à une famille de graphes géométriques de grande taille pour lesquels nous identifions des caractéristiques communes. Nous proposons une comparaison avec deux stratégies connues de streaming permettant de partitionner un graphe, à savoir LDG et FENNEL. Par rapport aux graphes que nous ciblons, nous définissons des métriques permettant d’identifier les cas d’usage où la solution ISP est la mieux adaptée. Les expérimentations montrent que dans des contextes favorables, la proportion d’arrêtes coupées (qui pénalisent les temps de traitement des requêtes concernant le graphe) peut être réduit drastiquement, passant de plus de 34% en utilisant FENNEL à moins de 1% en utilisant ISP.
Fichier principal
Vignette du fichier
11121ijdkp02.pdf (1.18 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03513456 , version 1 (05-01-2022)

Identifiers

Cite

Cyprien Gottstein, Philippe Raipin Parvedy, Michel Hurfin, Thomas Hassan, Thierry Coupaye. Partitioning Wide Area Graphs Using a Space Filling Curve. International Journal of Data Mining & Knowledge Management Process, 2021, 11 (1), pp.13-31. ⟨10.5121/ijdkp.2021.11102⟩. ⟨hal-03513456⟩
23 View
49 Download

Altmetric

Share

Gmail Facebook Twitter LinkedIn More