L’Institution national de l’audiovisuel (INA) a archivé la campagne présidentielle sur Internet, comme annoncé. Cela représente 80 millions d’URL. Depuis le 26 janvier, les 500 principales pages des sites recensés (plus de 2000) ont été capturés 4 fois par jour. Pendant les deux jours de scrutin, la page d’accueil de chaque site a été capturée tous les quarts d’heure.
http://www.01net.com/editorial/348531/e … par-l-ina/
Pour l’instant ces archives ne sont pas accessibles. Cependant un site en exploite les données de manière intéressante. Il analyse tout d’abord le bruit médiatique dans le temps, en comptant le nombre de notes de blogs concernant chaque candidat. Le schéma ci-dessous compare les courbes de présence dans la blogosphère des trois principaux candidats: Sarkozy, Bayrou et Ségolène Royal, du 1er au 13 mai. On constate que François Bayrou a presque totalement disparu, alors que les deux candidats encore présents au second tour montrent des résultats conformes à ce qui est sorti des urnes.
Plus intéressant encore est la cartographie des sites. Pour chaque site pris en compte, une carte permet de connaître les liens entre les différents sites (un site qui n’aurait aucun lien avec les autres n’apparaîtrait pas). Ci-dessous, on observe la manière dont le site Désirs d’avenir de Ségolène Royal est lié au reste de la blogosphère socialiste.
http://www.observatoire-presidentielle.fr
L’existence de ces archives est fondamentale. Pour autant qu’on soit capable de les conserver et d’en exploiter le contenu plus tard (ce qui n’est pas une mince affaire), elles serviront aux travaux des historiens.