Pourquoi Google est devenu plus fiable que les sondages d’opinion ?


#1

#2

Dommage que Numerama abuse de Google Analytics.


#3

Je suis un peu dubitatif sur la valeur de cette “étude”.

Alors certes, les sondages sont bidons pour savoir quoi que ce soit de l’opinion des gens (c’est pas nouveau). Mais de là à voir dans les suggestions de recherches Google un moyen d’éviter les biais, c’est très optimiste.

En réalité, il peut y avoir plein de faux positifs, des trolls, des militants très actifs, etc. C’est le fameux Google Bombing (quoi que je ne connais pas le terme exact pour “manipulation des suggestions de recherche”).

C’est d’ailleurs ce qu’a révélé une enquête de The Observer, relayée par The Guardian.

L’alt-right américaine par exemple adore jouer avec les résultats Google pour faire remonter des suggestions comme “le changement climatique est un hoax”, “l’homosexualité est un péché”, ou “l’alt-right n’est pas raciste”.

Plusieurs études (citées dans l’article mais sur lesquelles je ne me suis pas penché personnellement) montrent que ces suggestions peuvent avoir une influence sur la fabrication de l’opinion publique.

Mais à mon avis, les suggestions de recherches Google ne sont pas suffisantes pour pouvoir prédire quoi que ce soit. J’ai toujours eu un peu de mal avec les techniques soi-disant infaillibles qui peuvent tout prédire.


#4

Il faut arrêter d’accorder la moindre attention à ces suggestions qui sont du regardage de nombril, dont on sait qu’il est cybernétiquement instable.

Le mieux serait de les supprimer pour éviter que les gens se fassent influencer d’un côté, et que des sociologues de boudoir en jactent de l’autre.

Par contre, que Google accumule des connaissances stratégiques grâce au big data, ça ma paraît à la fois évident et préoccupant.


#5

Je ne comprends pas bien : c’est un problème quand Google recueille les informations “stratégiques”, mais il ne faut pas prêter attention quand Google diffuse ces mêmes informations ?


#6

Où vois-tu que Google les diffuse ? Tu penses bien que si Google produit des données “stratégiques” (consommation, santé, opinion …) , il n’a aucun intérêt à les diffuser. Mais à les utiliser pour lui-même ou les vendre à prix d’or.


#7

Les vendre = les diffuser.

Les utiliser pour lui-même ? A quoi ?
L’activité la plus rentable de Google, c’est la pub : donc toutes ces données, ils vont les utiliser pour leur régie publicitaire. Et pour convaincre les clients de signer des contrats avec eux, tu es bien obligé de montrer toute la valeur et la pertinence de ces données. Donc de les diffuser, au moins partiellement.

Cela ne sert à rien de stocker des masses de données si tu ne mets pas derrière des moteurs d’analyse prospective. Et en plus des moteurs efficaces.
Si tu recueilles des informations sur des gens qui veulent visiter Copenhague, tu as intérêt à leur balancer de la pub sur des tours guidés autour de la petite sirène plutôt que sur le Golden Gate.


#8

SI tu veux.

Donc c’est préoccupant que Google recueille des informations stratégiques et c’est préoccupant qu’il les “diffuse”.

Et je maintiens que les suggestions, c’est du bullshit inexploitable.


#9

Donc Google se fait chier à emmagasiner des milliards de données pour produire du bullshit.

Faudra peut-être le leur dire, histoire qu’ils s’économisent à la fois sur le recueil et à la fois sur la mise en place de systèmes d’analyses de ces données.


#10

“Les noirs puent”, “Benalla est l’amant de Macron”, oui c’est du bullshit. C’est du niveau cour de récré. Et l’article dont nous parlons est entièrement basé là-dessus.

Quand Google pourra prédire le résultat d’une élection, ou une épidémie, ou une inondation, ou la courbe des ventes de Lady Gaga en distillant sa big data (et il n’est pas dit qu’il en soit loin) , tu pourras dire qu’il a une information qui peut donner un avantage stratégique à celui qui la possède. Et là, ça devient préoccupant parce que ça peut être utilisé à mauvais escient. Je n’ai pas besoin de développer plus information = pouvoir.


#11

Parce que toi, tu ne vois pas le rapport entrée les régions où le mot bougnoul est cherché le plus souvent et les régions où le vote FN est le plus fort ? Tu penses que c’est juste une coïncidence ?

Ne t’en fais pas, ça vient ! Lorsque Google voit une explosion des recherches sur “symptômes de la grippe”, “fortes fièvres”,… il y a de fortes chances que l’épidémie arrive.
Et l’information est plus rapide que celle remontée par le réseau national de santé. En tout cas, je ne vois pas pourquoi les autorités de santé devraient ignorer cette information.

Oui, on sait. Mais, je pense que le jour où on est en dictature, ce sera le moindre de nos problèmes. Mais, si chaque fois qu’il y une évolution, on essaye de la stopper parce que “ouh la la, ça pourrait être mal utilisé”, on continuerait à chasser le bidon avec des bâtons même pas aiguisés.

Cela ne veut pas dire qu’il faille laisser faire n’importe quoi, mais big data et IA, ça va donner des choses intéressantes.


#12

Tu m’expliques comment on fait une carte du vote FN à partir des suggestions Google ?


#13

On ne parle pas des suggestions, mais des données stockées par Google.

Tu prends la répartition des recherches sur certains mots dans Google en fonction de la région en 2012, 2017, 2019
Tu prends la répartition des votes FN en fonction de la région en 2012, 2017, 2019
Tu calcules le coefficient de corrélation à la fois sur la région et sur la date.
Si tu t’aperçois que le coefficient est élevé, tu vas supposer que pour la prochaine élection, là où les recherches sur les mots sont faibles, le score du FN va être plus faible que là où les recherches sont élevées.

C’est tout l’intérêt de ces big data : pouvoir croiser des indicateurs entièrement différents et essayer de voir où ça matche ou pas. Après (mais ça les statisticiens le savent) il faut se méfier des variables cachées.


#14

C’est ce dont je te parle depuis le début. Et tu me réponds

Nous perdons notre temps.


#15

because of good users