Google a confirmé le retrait de son outil de mise en cache des sites web, qui avait pourtant plusieurs mérites. Peut-être qu’à l’avenir, il sera remplacé par le travail effectué par Internet Archive.

Le « cache » des sites web, que Google proposait sur son moteur de recherche, est officiellement mort. Dans la journée du 1er février, le compte officiel de l’entreprise américaine a confirmé la disparition de cette fonctionnalité, qui était pourtant fort commode pour continuer à voir un site si celui-ci est brièvement indisponible.

« Oui, [le cache] a été supprimé. Je sais, c’est triste. Je suis triste aussi. C’est l’une de nos plus anciennes fonctionnalités. Mais elle avait pour but d’aider les gens à accéder aux pages quand, il y a bien longtemps, on ne pouvait pas compter sur le chargement d’une page. De nos jours, les choses se sont grandement améliorées. »

En conséquence, rapporte Danny Sullivan, l’un des responsables du moteur de recherche, « il a donc été décidé de la supprimer ». Plusieurs internautes avaient constaté depuis quelques semaines l’absence de cet outil. La réponse de Danny Sullivan s’est d’ailleurs insérée dans un fil de discussion sur X (ex-Twitter) ouvert le 1er décembre 2023.

Une copie d’un site web, pour voir le contenu en cas d’indisponibilité

Le cache sur Google consiste en une sorte de « photographie » du site web à un instant donné, lorsque les robots d’indexation du moteur de recherche passent sur les pages. En clair, le cache d’un site web est une copie reflétant la dernière visite de Google. Un bouton dédié était accessible via les options de chaque lien visible sur le moteur.

Cette « vue » par Google avait un intérêt dans le cadre du travail dit SEOsearch engine optimization. Il était utile aux spécialistes pour vérifier de quelle façon les robots d’indexation de Google « voient » le site, et ainsi identifier et corriger d’éventuels problèmes.

Pour le public et pour les journalistes, cela avait aussi un intérêt. En cas d’indisponibilité d’un site (panne, fermeture, cyberattaque, etc.), cette « copie » permettait d’avoir un aperçu parfois très récent du contenu, et de retrouver des informations. Cela servait aussi repérer des changements depuis la dernière indexation de Google.

cache numerama
Le bouton du cache se trouvait dans la colonne de droite. // Source : Capture d’écran

Elle avait aussi le caractère pratique que Google a décrit sur Twitter : si le site se chargeait péniblement, passer par le cache pouvait être une option alternative. Mais avec le haut et le très haut débit qui ne cesse de s’étendre chez les internautes, et les serveurs de sites web qui ont de plus en plus de bande passante, ce souci est moins prégnant.

Internet Archive à la rescousse ?

On ignore si d’autres considérations ont pu peser dans la balance (le poids du stockage de toutes ces pages conservées en cache, avec les images ?). Toujours est-il que Danny Sullivan a esquissé la perspective de remplacer ce cache par le travail qu’effectue Internet Archive — qui met tout le net en cache, et est ainsi la mémoire du web.

« J’espère que nous ajouterons peut-être des liens vers Internet Archive à partir de l’endroit où nous avions le lien de cache auparavant […] C’est une ressource extraordinaire. Pour l’objectif de maîtrise de l’information […], je pense que ce serait également une bonne chose », a commenté Danny Sullivan.

« Je ne promets rien. Nous devons en parler, voir comment tout cela pourrait se dérouler — cela concerne des personnes qui me dépassent largement. Mais je pense que ce serait une bonne chose », a-t-il ajouté, en expliquant que cela permettrait toujours aux internautes de voir facilement comment une page a changé au fil du temps.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !