Publié par Julien L., le Mercredi 09 Juin 2010

Google Caffeine ambitionne de fournir un index constamment à jour

Longtemps secret, le projet Caffeine a finalement été rendu public l'année dernière. Mais ce n'est qu'hier qu'il a été effectivement été intégré à l'architecture de Google. Concrètement, Caffeine est une nouvelle méthode d'indexation des contenus sur le web. Il a pour ambition de proposer des résultats aussi à jour que possible.

On l'oublie sans doute un peu vite, mais le coeur de métier de Google reste bel et bien la recherche et l'indexation des contenus sur le web. Si les services et les projets se sont multipliés depuis sa naissance un certain 27 septembre 1998, la firme de Mountain View entend bien rester leader dans le domaine des moteurs de recherche. Et cela passe inévitablement par des améliorations constants de son outil.

Dans une note publiée sur le blog officiel de la firme, Carrie Grimes revient justement sur le tout dernier changement en date. En effet, la firme de Mountain View vient de réaliser un travail conséquent sur la manière dont son moteur de recherche analysait les pages web à la recherche de nouveaux contenus ou de nouveaux liens. Et le changement est d'importance.

Jusqu'à présent, la firme américaine considérait le web comme un agrégat de différentes couches d'information. Dans les faits, lorsque Google souhaitait mettre à jour son index, il devait parcourir l'ensemble du web, couche après couche. Et bien entendu, toutes ces informations ne s'actualisaient pas à la même vitesse.

"Notre vieil index comporte un certain nombre de couches, dont certaines étaient actualisées plus rapidement que d'autres; la couche principale était mise à jour toutes les deux semaines. Pour actualiser une couche de l'ancien indice, nous devons analyser l'ensemble du web, ce qui veut dire qu'il y avait un retard important entre le moment où nous avons déniché une page et le moment où nous la mettons à votre disposition" explique l'ingénieur logiciel.

C'est là que "Caffeine" entre en jeu. Cet outil, dévoilé l'année dernière, a pour ambition de proposer une toute nouvelle méthode d'indexation des contenus sur le web, afin de permettre aux utilisateurs de bénéficier de résultats aussi à jour que possible. "Caffeine fournit des résultats 50 % plus actualisés que notre précédent index" est-il par ailleurs précisé. Et selon Carrie Grimes, l'outil est en place depuis peu sur les serveurs de l'entreprise.

Concrètement, Caffeine va mettre à jour son index par petites portions. "Nous analysons le web par petites portions et mettons à jour notre index de recherche au fur et à mesure, et de manière globale. À mesure que nous dénichons de nouvelles pages ou de nouvelles informations, nous pouvons intégrer ces données directement dans l'index. Cela veut dire que vous pouvez obtenir des informations à jour encore plus rapidement qu'avant - qu'importe quand et ou elles ont été publiées".

Reste maintenant à savoir comment la concurrence réagira à cette nouvelle innovation de Google en matière de recherche sur le web. Bing, qui est arrivé sur le marché en mai 2009, connait un certain succès outre-Atlantique, puisqu'il s'est rapidement porté à hauteur de Yahoo, un autre ténor de la recherche. Au final, qu'importe l'issue de la bataille, c'est bel et bien l'utilisateur qui en sortira grand gagnant.

Publié par Julien L., le 9 Juin 2010 à 15h43
 
4
Commentaires à propos de «Google Caffeine ambitionne de fournir un index constamment à jour»
Inscrit le 15/08/2008
2840 messages publiés
Ils en tiennent une couche!!!



....=>
Inscrit le 30/10/2008
699 messages publiés
Un protocole comme le pubsubhubbub appliqué aux sites webs, ça ce serait génial pour l'index des moteurs de recherche!
Inscrit le 20/11/2004
2070 messages publiés
Deux semaines pour la couche principale ? o_O

Moi mes sites web, il m'arrive de recevoir du traffic google sur des pages internes vieilles de deux jours, je suis un hacker de génie qui pirate google pendant son sommeil, ou une information m'aura échappé ? o_O
Inscrit le 16/06/2010
1 messages publiés
s'il en croit les 2 études relatées dans cette vidéo http://www.__youtube...h?v=8bTjDTDIZ00 , les bases de google ne sont pas plus fraiches après Caffeine qu'avant...
Répondre

Tous les champs doivent être remplis.

OU

Tous les champs doivent être remplis.

FORUMS DE NUMERAMA
Poser une question / Créer un sujet
vous pouvez aussi répondre ;-)
Numerama sur les réseaux sociaux
Juin 2010
 
Lu Ma Me Je Ve Sa Di
31 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 1 2 3 4
5 6 7 8 9 10 11