LiveRank : comment faire du neuf avec du vieux ?

Résumé : Une capture du Web n'est valable qu'à l'instant où elle est faite et se périme ensuite petit à petit. Dans cet article, nous cherchons à savoir comment récupérer d'une ancienne capture un maximum de pages toujours vivantes en un minimum de requêtes. Plus précisément notre contribution est la suivante : nous posons le problème sous la forme du calcul d'un ranking, le LiveRank, qui essaie de séparer les pages mortes des pages vivantes ; nous proposons plusieurs LiveRanks basés sur le PageRank, avec ou sans apprentissage ; nous validons notre approche sur un graphe réel et évaluons numériquement le gain que peut apporter un bon LiveRank.
Document type :
Conference papers
Liste complète des métadonnées

Cited literature [4 references]  Display  Hide  Download

https://hal.inria.fr/hal-00986031
Contributor : Fabien Mathieu <>
Submitted on : Wednesday, April 30, 2014 - 6:02:43 PM
Last modification on : Friday, January 4, 2019 - 5:33:21 PM
Document(s) archivé(s) le : Wednesday, July 30, 2014 - 2:15:10 PM

File

liverank.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00986031, version 1

Citation

The Dang Huynh, Fabien Mathieu, Laurent Viennot. LiveRank : comment faire du neuf avec du vieux ?. ALGOTEL 2014 -- 16èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications, Jun 2014, Le Bois-Plage-en-Ré, France. pp.1-4. ⟨hal-00986031⟩

Share

Metrics

Record views

313

Files downloads

236