Publié par Guillaume Champeau, le Mercredi 23 Novembre 2011

Cher Google, plus frais ne veut pas dire plus pertinent

Contrairement au poisson, ce qui est frais n'est pas forcément meilleur que ce qui est congelé, sur Internet. Une réalité que semble totalement délaisser Google, pour qui un contenu vieux mais pertinent sera nécessairement moins bien classé qu'un contenu plus récent mais de moindre intérêt.

Il y a quelques semaines, nous avions publié un article extrêmement commenté sur la dernière grande mise à jour des algorithmes de Google, en dénonçant le comportement économiquement irresponsable de la firme de Mountain View. Du jour au lendemain, cette modification impactait en effet 35 % des requêtes, avec pour objectif non plus d'éliminer les tricheurs qui abusent des techniques de SEO, ce qui serait compréhensible, mais de donner la primeur aux contenus les plus frais. Ainsi ceux qui ont publié des contenus de référence plus anciens se retrouvent lésés au profit de ceux qui ont publié des contenus de moindre qualité ou de qualité égale, mais plus récents.

Pour un site d'actualités comme Numerama, où le contenu est sans cesse renouvelé, l'impact d'une telle mise à jour est évidemment positif. Néanmoins, nous ne sommes pas convaincus que l'utilisateur y trouve toujours son compte. A trop privilégier la fraîcheur, le moteur de recherche en a oublié sa mission première : la pertinence.

Prenons un exemple concret. Et prenons-le avec nos propres articles, pour éviter tout jugement de valeur sur les contenus des confrères.

Pour mettre en contexte nos éditoriaux, nous créons régulièrement des liens vers nos précédents articles sur le même sujet, qui permettent à ceux qui le souhaitent d'approfondir. C'est ce que nous avons fait il y a quelques heures dans cet article sur le projet de loi copie privée, qui nécessitait de rappeler la jurisprudence et d'autres informations contextuelles. Parmi ces dernières, nous voulions rappeler le fonctionnement du label PUR accordé par l'Hadopi, et l'absurdité de la procédure qui se base non pas sur une vérification de la légalité du site, mais sur une absence de contestation de cette légalité. Or ça tombe bien, nous avions consacré tout un article à analyser le décret qui fixe cette procédure et à démontrer ses failles.

Comme c'est généralement plus rapide qu'en passant par notre (excellent !) moteur de recherche interne, nous utilisons Google pour effectuer la recherche de l'article dans lequel nous avions décrit cette procédure. Nous saisissons 6 mots clés : "label offre légale procédure hadopi numerama". Généralement, ça suffit. Mais là, le résultat n'est pas des plus pertinents. Google ressort des articles de pure actualité sur les différentes plateformes qui ont demandé leur label, qui n'ont pas grand intérêt une fois l'actualité passée, et non l'article de référence que nous cherchons :

Il a donc fallu préciser "décret" dans la recherche pour enfin retrouver notre article de référence, ce qui n'aurait pas été nécessaire avant la mise à jour :

Plutôt que d'afficher en premier résultat l'article de référence, qui a généré beaucoup plus de lectures, de commentaires, de "retweets" et autres reprises, Google a préféré afficher nos articles légèrement plus récents, mais beaucoup moins intéressants. Et c'est malheureusement une tendance lourde que l'on retrouve dans énormément de recherches, qu'elles concernent ou non Numerama.

Ici, nous recherchions un article publié publié en 2010. Retrouver ceux que nous avons publié avant 2009 relève désormais de l'exploit.

La seule solution (lorsque ça fonctionne) est d'obliger Google à rechercher les résultats publiés dans une période donnée, ce qui n'est valable que lorsque l'on sait très précisément ce que l'on recherche. Il aurait été beaucoup plus intéressant de la part de Google de proposer un curseur qui permette à l'utilisateur de choisir lui-même le niveau de fraîcheur qui l'intéresse.

Publié par Guillaume Champeau, le 23 Novembre 2011 à 17h53
 
30
Commentaires à propos de «Cher Google, plus frais ne veut pas dire plus pertinent»
Inscrit le 23/02/2011
432 messages publiés
C'est juste la première étape pour les contenus frais. Vous faites un procès mais il n'y a aucune patience, trop facile . Avec 500 modifications de l'algo par an, d'ici quelques semaines les défauts seront corrigés, comme d'hab.
Inscrit le 26/03/2010
7 messages publiés
Sauf que rien ne prouve dans votre démonstration que la version d'avant aurait remonté cet article sans mettre le mot "décret".
Ce n'est qu'une pure supposition.
Néanmoins je suis d'accord sur le fond sur les problèmes induits par ce changement.
Inscrit le 23/02/2011
432 messages publiés
Moins frais ne veut pas dire plus pertinent non plus. Donc patience que les choses reviennent en ordre, si vous pensez que l'indexation de tous les sites web se fait d'un coup de baguette magique ...
Inscrit le 28/11/2008
3160 messages publiés
Bah quoi ? J'aime bien les sardines en conserve, moi
Moi qui apporte de temps en temps de nouveaux éléments dans mes anciens articles, je me demande si Google prend en compte juste la date de publication ou si une modification redonne à l'article "une jeunesse". Facile à détecter grâce au sitemap, mais ce moyen ne pourrait-il pas être abusé, pour faire passer pour "neufs" des articles qui ont été pas ou peu modifiés ?

ps: Quand on parle de la fraicheur ou de la pertinence avec Google, je remarque que Bing n'a pratiquement ni l'un ni l'autre. Yahoo pareil. *pour du contenu non "gros groupe de presse".
Inscrit le 15/08/2008
2853 messages publiés
Une grosse chtite faute !

Cher Google, plus frais ne veut pas dire plus pertinent
=>
Chez Google, plus frais ne veut pas dire plus pertinent
Inscrit le 13/08/2002
24728 messages publiés
herbeapipe, le 23/11/2011 - 18:57
Une grosse chtite faute !

Cher Google, plus frais ne veut pas dire plus pertinent
=>
Chez Google, plus frais ne veut pas dire plus pertinent


Non, on s'adresse à Google
Inscrit le 23/11/2011
1 messages publiés
@Arkados réflexion intéressante Faudrait tester

Sinon pour compléter l'article, on peut prendre un exemple bien plus courant ces temps : le déterrage de "buzz" ou "news".
Un événement ancien, une vidéo ou une découverte scientifique se met à faire le buzz, juste parce que un grand site de presse ou de ferme de contenus a publié dessus (il n'avait pas assez d'actu fraiche, la flemme ou que sais-je..)
Et paf quand vous ferez une recherche, l'article originel -celui du scientifique/organisateur/vidéaste- n'apparaitra pas dans une recherche google !!!
Comment inciter les gens à publier du contenu, si au final ils n'ont aucunes retombées, aucune visibilité dans la masse de contenu et de site "d'actualités" !
Inscrit le 23/11/2011
2 messages publiés
Pour ma part depuis que les algorithmes ont changé, je tombe bien trop souvent sur des vieilles pages dépassées. Notamment les forums quand on recherche des infos sur un problème informatique. C'est terriblement frustrant.
Inscrit le 20/09/2011
5137 messages publiés
C'est très simple : si les résultats fournis par Google ne correspondent plus aux attentes des utilisateurs, ceux-ci se tourneront vers d'autres moteurs de recherche.

Où est le problème ?

Et puis, ne vous en faites pas : Google est suffisamment pragmatique pour réagir s'ils s'aperçoivent que les internautes vont davantage sur la page 2 ou 3 pour trouver ce qui les intéresse.
Inscrit le 10/02/2011
16 messages publiés
C'est très simple : si les résultats fournis par Google ne correspondent plus aux attentes des utilisateurs, ceux-ci se tourneront vers d'autres moteurs de recherche.

Crois tu vraiment que les gens vont se tourner vers yahoo ou bing( la blague, ils ont du s'allier pour être crédible) s'ils ne trouvent pas ?
Non, google fait juste ce que bon lui chante. On commence à selectionner les informations que l'on va proposer aux gens et apres on orientera l'information et les gens suivront...

Où est le problème ?

Il faut arreter de croire que Google est un Saint et bienvaillants.
Ils ont atteint une telle taille (et la part de marché qui va avec) qu'ils ont les moyens d'imposer des tendances.
franam, le 23/11/2011 - 19:37
Crois tu vraiment que les gens vont se tourner vers yahoo ou bing( la blague, ils ont du s'allier pour être crédible) s'ils ne trouvent pas ?
Non, google fait juste ce que bon lui chante. On commence à selectionner les informations que l'on va proposer aux gens et apres on orientera l'information et les gens suivront...

Depuis que je suis sur le net, j'ai utilisé 4 moteurs de manière massive: altavista, yahoo, metacrawler et google.
Deux d'entre eux étaient très populaires et se sont écroulés.
Pourquoi Google serait-il différent ?
Inscrit le 18/06/2011
871 messages publiés
nous utilisons Google pour effectuer la recherche de l'article

Ah c'est comme ça!!
Je me suis toujours demandé comment les rédacteurs se rapellais de tout les article qu'ils avaient pondu sur le sujet et ressortait les lien pour les mettre dans l'article!! En réalité vous n'êtes que des hommes
Inscrit le 12/03/2009
115 messages publiés
Pour ma part depuis que les algorithmes ont changé, je tombe bien trop souvent sur des vieilles pages dépassées. Notamment les forums quand on recherche des infos sur un problème informatique. C'est terriblement frustrant.


Ca me rassure je pensais etre le seul a etre confronté a ce soucis... les api de programmations qui se retrouvent en 5-6eme position, précédé par des tutos mal foutu ou des messages de forum dont la réponse la plus pertinente est "google is your friends noob"
Inscrit le 20/11/2004
2125 messages publiés
Wurrzounet, le 23/11/2011 - 20:17
Pour ma part depuis que les algorithmes ont changé, je tombe bien trop souvent sur des vieilles pages dépassées. Notamment les forums quand on recherche des infos sur un problème informatique. C'est terriblement frustrant.


Ca me rassure je pensais etre le seul a etre confronté a ce soucis... les api de programmations qui se retrouvent en 5-6eme position, précédé par des tutos mal foutu ou des messages de forum dont la réponse la plus pertinente est "google is your friends noob"


Sans compter l'ennemi absolu des requêtes google, CES PUTAINS DE FORUMS COMMENTCAMARCHE.NET ! >_<

Que Google, se basant sur mon surf quotidien me suggère trop de hentai, de cul, de webcomics, de pages geeks, je ne m'étonne pas. Mais pourquoi me pourrir mes résultats de recherche avec toujours ces forums commentcamarche (alors que ça ne répond jamais comme il faut), ça, ça me dépasse.

Je vous souhaite de ne pas avoir des résultats pollués comme moi, les gars, c'est vraiment énervant.

Ah, si seulement on pouvait bannir des domaines des résultats de recherche !
[message édité par Sabinou le 23/11/2011 à 20:32 ]
Inscrit le 15/07/2011
593 messages publiés
Tient c'est vrai que je tombais dessus souvent. Depuis peu, j'utilise Ixquick, et c'est vraiment pas mal. Des fois, je dois faire appel à Google et Bing, mais pour le moment, c'est Ixquick par défaut.
Inscrit le 12/10/2004
556 messages publiés
Sabinou, le 23/11/2011 - 20:31
Wurrzounet, le 23/11/2011 - 20:17
Pour ma part depuis que les algorithmes ont changé, je tombe bien trop souvent sur des vieilles pages dépassées. Notamment les forums quand on recherche des infos sur un problème informatique. C'est terriblement frustrant.


Ca me rassure je pensais etre le seul a etre confronté a ce soucis... les api de programmations qui se retrouvent en 5-6eme position, précédé par des tutos mal foutu ou des messages de forum dont la réponse la plus pertinente est "google is your friends noob"


Sans compter l'ennemi absolu des requêtes google, CES PUTAINS DE FORUMS COMMENTCAMARCHE.NET ! >_<

Que Google, se basant sur mon surf quotidien me suggère trop de hentai, de cul, de webcomics, de pages geeks, je ne m'étonne pas. Mais pourquoi me pourrir mes résultats de recherche avec toujours ces forums commentcamarche (alors que ça ne répond jamais comme il faut), ça, ça me dépasse.

Je vous souhaite de ne pas avoir des résultats pollués comme moi, les gars, c'est vraiment énervant.

Ah, si seulement on pouvait bannir des domaines des résultats de recherche !


Moi j'ai désactivé ce site de mes recherches. Sans forcément avoir de compte google, il existe une extention chromium pour faire ça.
Inscrit le 03/06/2011
346 messages publiés
Et vous avez teste avec Bing voir ce que donnerait les resultats ? J'ai regarde vite fait dans mon coin et ce n'est pas mieux, meme en precisant decret bing ne me sort pas l'article en question.

Faut croire que les technologies qui avancent n'ameliore pas les moteurs de recheche en general
Inscrit le 12/08/2009
9 messages publiés
Je trouve qu'on devrait toujours pouvoir donner, si on le souhaite, une indication de date pour l'information qu'on cherche. Exemple, je cherche des infos sur une expo de peinture consacrée à van Gogh qui se tenait il y a 3 ans, on devrait pouvoir indiquer - exposition van gogh - et 2008...
j2mcrusoe, le 24/11/2011 - 08:27

Je trouve qu'on devrait toujours pouvoir donner, si on le souhaite, une indication de date pour l'information qu'on cherche. Exemple, je cherche des infos sur une expo de peinture consacrée à van Gogh qui se tenait il y a 3 ans, on devrait pouvoir indiquer - exposition van gogh - et 2008...

D'une part tu peux le faire en cherchant simplement "exposition van gogh 2008", d'autre part tu peux le faire plus proprement en utilisant la barre de gauche une fois la recherche lancée (période personnalisée)
Inscrit le 30/03/2010
1089 messages publiés
Sabinou, le 23/11/2011 - 20:31
Wurrzounet, le 23/11/2011 - 20:17
Pour ma part depuis que les algorithmes ont changé, je tombe bien trop souvent sur des vieilles pages dépassées. Notamment les forums quand on recherche des infos sur un problème informatique. C'est terriblement frustrant.


Ca me rassure je pensais etre le seul a etre confronté a ce soucis... les api de programmations qui se retrouvent en 5-6eme position, précédé par des tutos mal foutu ou des messages de forum dont la réponse la plus pertinente est "google is your friends noob"


Sans compter l'ennemi absolu des requêtes google, CES PUTAINS DE FORUMS COMMENTCAMARCHE.NET ! >_<

Que Google, se basant sur mon surf quotidien me suggère trop de hentai, de cul, de webcomics, de pages geeks, je ne m'étonne pas. Mais pourquoi me pourrir mes résultats de recherche avec toujours ces forums commentcamarche (alors que ça ne répond jamais comme il faut), ça, ça me dépasse.

Je vous souhaite de ne pas avoir des résultats pollués comme moi, les gars, c'est vraiment énervant.

Ah, si seulement on pouvait bannir des domaines des résultats de recherche !


je suppose qu'un "-commentcamarche" ajouté dans la recherche devrait suffire ...
Inscrit le 24/11/2011
1 messages publiés
Et bien, je suis plus d'accord avec google, je préfère l'information fraîche, pour la plupart de mes recherches, un article qui date même que de 2 ans est obselète pour moi. Aujourd'hui le monde évolue tellement vite et dans beaucoup de domaine !
Bref, je ne pense pas que google ai fauté.
(et je ne pense pas non plus que google meurt un jour comme d'autre moteur de recherche, tout simplement parce que google fait bcp plus de choses, au gout du jour, moderne, il est présent dans bcp d'amélioration high tech..etc)
Inscrit le 28/05/2003
494 messages publiés
Mouais...
D'une, rien ne dit que cela aurait été différent avant.

De deux, la recherche "label offre légale procédure hadopi numerama" cite logiquement les articles parlant de l'offre légale, de sociétés ayant eu le label...

Je pense honnêtement que votre recherche ne correspond pas à ce que vous recherchez...
Inscrit le 19/02/2011
49 messages publiés
Nycom, le 24/11/2011 - 11:17
Mouais...
D'une, rien ne dit que cela aurait été différent avant.

De deux, la recherche "label offre légale procédure hadopi numerama" cite logiquement les articles parlant de l'offre légale, de sociétés ayant eu le label...

Je pense honnêtement que votre recherche ne correspond pas à ce que vous recherchez...

J'ai rien dit.
[message édité par Khalev le 24/11/2011 à 11:32 ]
Inscrit le 28/08/2004
6873 messages publiés
Question étrange...après tout, l'algorithme ne peut pas savoir à notre place si pour notre recherche, il vaut mieux du récent ou pas.

Cela dépend de ce qu'on cherche, et aucun moteur de recherche ne peut faire ce tri-là. Entre une question d'informatique et une recette de gâteau, la fraîcheur de la page n'a pas du tout le même impact.

Plutôt que d'accuser Google, il faudrait que l'internaute lambda apprenne à chercher: ajouter des mots avec + et - pour préciser sa recherche, mettre une année, et surtout, regarder plus loin que la première page.

Bref, ne pas vouloir du tout cuit, surtout quand on cherche une aiguille dans une botte de foin.
[message édité par Elisheva le 24/11/2011 à 11:45 ]
Inscrit le 03/10/2011
6626 messages publiés
Elisheva, le 24/11/2011 - 11:44
Question étrange...après tout, l'algorithme ne peut pas savoir à notre place si pour notre recherche, il vaut mieux du récent ou pas.

Cela dépend de ce qu'on cherche, et aucun moteur de recherche ne peut faire ce tri-là. Entre une question d'informatique et une recette de gâteau, la fraîcheur de la page n'a pas du tout le même impact.

Plutôt que d'accuser Google, il faudrait que l'internaute lambda apprenne à chercher: ajouter des mots avec + et - pour préciser sa recherche, mettre une année, et surtout, regarder plus loin que la première page.

Bref, ne pas vouloir du tout cuit, surtout quand on cherche une aiguille dans une botte de foin.
Il pourrait par exemple le définir en option dans les paramètres de recherche ou dans recherche avancée. Que la recherche d'actualité se fassent par date, c'est normal, que la recherche de la tarte aux groseilles se fassent par date, c'est juste débile (la recette de grand-mère est forcément meilleure).
Inscrit le 24/11/2011
5 messages publiés
Cher Guillaume Champeau, quand on est pas foutu de se servir correctement des features du moteur de recherche Google, on s'abstient de critiquer.

http://lmgtfy.com/?q...ww.numerama.com
Inscrit le 20/03/2009
1141 messages publiés
c'est un équilibre difficile a trouver: si on fait des recherches "historiques", alors oui la pertinence est souvent peu dépendante du temps. en revanche, si on cherche dans un domaine de pointe (au hasard: l'informatique) il y a de grandes chances qu'une info de plus d'un an soit totalement périmée et sans importance.
test en live: cherchez "mac os vmware", un paquet d'infos datent de 2005-2008, et on en a rien a taper!
Inscrit le 15/08/2008
2853 messages publiés
Guillaume, le 23/11/2011 - 19:01
herbeapipe, le 23/11/2011 - 18:57
Une grosse chtite faute !

Cher Google, plus frais ne veut pas dire plus pertinent
=>
Chez Google, plus frais ne veut pas dire plus pertinent


Non, on s'adresse à Google


Ah oki dsl. Je n'avais pas eu le temps de lire l'article. Mais ça me semblait bizarre "cher google".
Inscrit le 30/11/2011
1 messages publiés
Google répond à la mentalité actuelle, la course effrénée à l'actu sans vérification, toujours cette course à "qui sera le prems à poster l'info". Google ne fait qu'affiner ici une pratique existant depuis un moment déjà, le site privilégiant les sites dynamiques et les MàJ à outrance (d'où le succès du référencement des blogs, dont peu sont crédibles).

Or, se contenter de l'actu est une grossière erreur. Ex: si un site plagie un vieil article de Numerama, il sera mieux référencé et on perd la source, un écueil dans lequel plonge les médias constamment: il suffit de crier "je suis le premier" pour que tout le monde vous croit car il devient très dur de prouver le contraire tant les vieilles info s'enfoncent dans les pages recherche de google: impossible de chercher l'info la plus ancienne, seules des recherches entre telle et telle date (ou une date précise) sont possibles, ça en dit long sur la philosophie du traitement de l'info et la propagande médiatique qui l'accompagne. Un ex., je vois encore une donnée relative à l'impact environnemental d'un tél mobile reprise régulièrement dans la presse qui date de...2000, calculée par un seul chercheur qui l'a présentée lors d'une conférence. Et aujourd'hui, à moins de le savoir, c'est quasi impossible de retrouver la référence. Or entre une donnée de 2000 et l'avènement des smartphones...
[message édité par Pulsar le 30/11/2011 à 18:57 ]
Inscrit le 01/12/2011
1 messages publiés
D'ailleurs cette tendance, on la voit très clairement du moment ou on tape sur des informations relatives à la politique sur la barre de recherche google, et on vient de confirmer ça durant les révolutions du printemps arabe !!
Répondre

Tous les champs doivent être remplis.

OU

Tous les champs doivent être remplis.

FORUMS DE NUMERAMA
Poser une question / Créer un sujet
vous pouvez aussi répondre ;-)
Numerama sur les réseaux sociaux
Novembre 2011
 
Lu Ma Me Je Ve Sa Di
31 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 1 2 3 4
5 6 7 8 9 10 11