Archivage du Web

Pierre Senellart 1, 2
2 VALDA - Value from Data
DI-ENS - Département d'informatique de l'École normale supérieure, Inria de Paris
Résumé : L’archivage du Web est un processus de collecte, de sélection, d’enrichissement, de stockage, de préservation et de mise à disposition des informations du Web actuel, afin qu’elles restent accessibles aux utilisateurs dans l’avenir. L’objectif de cette démarche est de permettre, par exemple, à un historien dans trente ans de pouvoir étudier la manière dont un événement politique a été commenté par les parties prenantes, les médias et les simples utilisateurs du Web ; à un juge de pouvoir décider dans cinq ans si telle action était en violation des termes d’utilisation d’un service Web tels qu’ils étaient formulés à l’époque des faits ; ou encore, à un sociologue de réaliser dans vingt ans une étude diachronique d’une communauté à travers les traces que cette communauté a laissées sur le Web.
Document type :
Book sections
Complete list of metadatas

https://hal.inria.fr/hal-01497800
Contributor : Pierre Senellart <>
Submitted on : Tuesday, April 4, 2017 - 3:47:23 PM
Last modification on : Thursday, February 7, 2019 - 4:56:41 PM
Long-term archiving on : Wednesday, July 5, 2017 - 5:55:52 PM

File

Archivage_du_Web.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01497800, version 1

Citation

Pierre Senellart. Archivage du Web. Les Big Data à découvert, CNRS Éditions, 2017, 978-2-271-11464-8. ⟨hal-01497800⟩

Share

Metrics

Record views

292

Files downloads

98