Ceci est une archive de l'ancien forum de Numerama. Il n'est plus accessible. Vous êtes probablement arrivés ici par erreur. Cliquez ici pour revenir sur la page d'accueil.

Pourquoi Google est devenu plus fiable que les sondages d’opinion ?

Neuro le 03/06/2019 à 10:42

anon43031639 le 03/06/2019 à 12:04

Dommage que Numerama abuse de Google Analytics.

unMarxetcarepart le 05/06/2019 à 02:54

Je suis un peu dubitatif sur la valeur de cette “étude”.

Alors certes, les sondages sont bidons pour savoir quoi que ce soit de l’opinion des gens (c’est pas nouveau). Mais de là à voir dans les suggestions de recherches Google un moyen d’éviter les biais, c’est très optimiste.

En réalité, il peut y avoir plein de faux positifs, des trolls, des militants très actifs, etc. C’est le fameux Google Bombing (quoi que je ne connais pas le terme exact pour “manipulation des suggestions de recherche”).

C’est d’ailleurs ce qu’a révélé une enquête de The Observer, relayée par The Guardian.

L’alt-right américaine par exemple adore jouer avec les résultats Google pour faire remonter des suggestions comme “le changement climatique est un hoax”, “l’homosexualité est un péché”, ou “l’alt-right n’est pas raciste”.

Plusieurs études (citées dans l’article mais sur lesquelles je ne me suis pas penché personnellement) montrent que ces suggestions peuvent avoir une influence sur la fabrication de l’opinion publique.

Mais à mon avis, les suggestions de recherches Google ne sont pas suffisantes pour pouvoir prédire quoi que ce soit. J’ai toujours eu un peu de mal avec les techniques soi-disant infaillibles qui peuvent tout prédire.

dev_tty le 05/06/2019 à 07:36

Il faut arrêter d’accorder la moindre attention à ces suggestions qui sont du regardage de nombril, dont on sait qu’il est cybernétiquement instable.

Le mieux serait de les supprimer pour éviter que les gens se fassent influencer d’un côté, et que des sociologues de boudoir en jactent de l’autre.

Par contre, que Google accumule des connaissances stratégiques grâce au big data, ça ma paraît à la fois évident et préoccupant.

Pollux1 le 05/06/2019 à 08:17

Je ne comprends pas bien : c’est un problème quand Google recueille les informations “stratégiques”, mais il ne faut pas prêter attention quand Google diffuse ces mêmes informations ?

dev_tty le 05/06/2019 à 09:00

Où vois-tu que Google les diffuse ? Tu penses bien que si Google produit des données “stratégiques” (consommation, santé, opinion …) , il n’a aucun intérêt à les diffuser. Mais à les utiliser pour lui-même ou les vendre à prix d’or.

Pollux1 le 05/06/2019 à 11:49

Les vendre = les diffuser.

Les utiliser pour lui-même ? A quoi ?
L’activité la plus rentable de Google, c’est la pub : donc toutes ces données, ils vont les utiliser pour leur régie publicitaire. Et pour convaincre les clients de signer des contrats avec eux, tu es bien obligé de montrer toute la valeur et la pertinence de ces données. Donc de les diffuser, au moins partiellement.

Cela ne sert à rien de stocker des masses de données si tu ne mets pas derrière des moteurs d’analyse prospective. Et en plus des moteurs efficaces.
Si tu recueilles des informations sur des gens qui veulent visiter Copenhague, tu as intérêt à leur balancer de la pub sur des tours guidés autour de la petite sirène plutôt que sur le Golden Gate.

dev_tty le 05/06/2019 à 12:31

SI tu veux.

Donc c’est préoccupant que Google recueille des informations stratégiques et c’est préoccupant qu’il les “diffuse”.

Et je maintiens que les suggestions, c’est du bullshit inexploitable.

Pollux1 le 05/06/2019 à 15:29

Donc Google se fait chier à emmagasiner des milliards de données pour produire du bullshit.

Faudra peut-être le leur dire, histoire qu’ils s’économisent à la fois sur le recueil et à la fois sur la mise en place de systèmes d’analyses de ces données.

dev_tty le 05/06/2019 à 15:44

“Les noirs puent”, “Benalla est l’amant de Macron”, oui c’est du bullshit. C’est du niveau cour de récré. Et l’article dont nous parlons est entièrement basé là-dessus.

Quand Google pourra prédire le résultat d’une élection, ou une épidémie, ou une inondation, ou la courbe des ventes de Lady Gaga en distillant sa big data (et il n’est pas dit qu’il en soit loin) , tu pourras dire qu’il a une information qui peut donner un avantage stratégique à celui qui la possède. Et là, ça devient préoccupant parce que ça peut être utilisé à mauvais escient. Je n’ai pas besoin de développer plus information = pouvoir.

Pollux1 le 05/06/2019 à 18:30

Parce que toi, tu ne vois pas le rapport entrée les régions où le mot bougnoul est cherché le plus souvent et les régions où le vote FN est le plus fort ? Tu penses que c’est juste une coïncidence ?

Ne t’en fais pas, ça vient ! Lorsque Google voit une explosion des recherches sur “symptômes de la grippe”, “fortes fièvres”,… il y a de fortes chances que l’épidémie arrive.
Et l’information est plus rapide que celle remontée par le réseau national de santé. En tout cas, je ne vois pas pourquoi les autorités de santé devraient ignorer cette information.

Oui, on sait. Mais, je pense que le jour où on est en dictature, ce sera le moindre de nos problèmes. Mais, si chaque fois qu’il y une évolution, on essaye de la stopper parce que “ouh la la, ça pourrait être mal utilisé”, on continuerait à chasser le bidon avec des bâtons même pas aiguisés.

Cela ne veut pas dire qu’il faille laisser faire n’importe quoi, mais big data et IA, ça va donner des choses intéressantes.

dev_tty le 06/06/2019 à 02:25

Tu m’expliques comment on fait une carte du vote FN à partir des suggestions Google ?

Pollux1 le 06/06/2019 à 06:58

On ne parle pas des suggestions, mais des données stockées par Google.

Tu prends la répartition des recherches sur certains mots dans Google en fonction de la région en 2012, 2017, 2019
Tu prends la répartition des votes FN en fonction de la région en 2012, 2017, 2019
Tu calcules le coefficient de corrélation à la fois sur la région et sur la date.
Si tu t’aperçois que le coefficient est élevé, tu vas supposer que pour la prochaine élection, là où les recherches sur les mots sont faibles, le score du FN va être plus faible que là où les recherches sont élevées.

C’est tout l’intérêt de ces big data : pouvoir croiser des indicateurs entièrement différents et essayer de voir où ça matche ou pas. Après (mais ça les statisticiens le savent) il faut se méfier des variables cachées.

dev_tty le 06/06/2019 à 07:16

C’est ce dont je te parle depuis le début. Et tu me réponds

Nous perdons notre temps.

james456 le 08/06/2019 à 10:51

because of good users

twnicotine le 16/02/2020 à 15:16

Salut @dev_tty, je suis novice sur Numerama, j’essaie de comprendre, j’ai 35 ans d’expérience et je n’ai rien compris à cause de @paulux1, un vrai foutoir j’ai même pas eu droit à un bonjour à mon 1er sujet, on dirait schtroumpf grognon. Vente=Diffusion…

C’est pas méchant chacun son caractère mais le respect avant tout.

Avez vous déjà travaillé ou travailler encore chez Google ? Les prédictions sont proposées par rapport aux nombre de phrases exact que Google reçoivent plusieurs fois dans leurs requêtes, algorithme s’inspire simplement des questions des autres users pour les aider et proposer des suggestions.

C’est tout con.

Amicalement

dev_tty le 16/02/2020 à 20:33

Bonjour twnicotine. Il n’y a pas de bizutage sur Numerama. Gardez le sourire inconditionnellement et tout se passera bien.

PS : Non, je ne travaille pas chez Google.

twnicotine le 17/02/2020 à 07:40

Bonjour @dev_tty, je garde le sourire, j’essaie d’aider comme je peux

Amicalement

Fastlink le 24/05/2020 à 09:59

Le raisonnement inverse est tout aussi valable: là où le score risque d’être plus élevé, nul besoin de faire des recherches, les personnes ont déjà leurs opinions. Par contre, là où il y a des recherches, ça peut être les régions où cest le plus faible. On peut mixer les deux raisonnements ce qui rend toute prédiction complexe.
Le mieux serait que Google partage ses données afin que chacun se fasse son jugement :).

Pollux1 le 24/05/2020 à 10:45

Certes, les personnes ont déjà leur opinion, mais ils aiment bien qu’elles soient confirmées.
Quand tu vas dans un meeting politique, tu trouveras une immense majorité de gens qui ont déjà leur opinion et qui sont d’accord avec les orateurs. Alors qu’ils n’ont pas besoin d’y aller parce qu’ils savent ce qui va être dit et qu’ils sont déjà convaincus.

Je n’y crois pas trop.
Les gens ont tendance à regarder ce qu’il se passe chez eux et ce qui les concerne, pas ce qu’il se passe chez le voisin (statistiquement parlant bien entendu).

Je pense qu’en France les recherches “quel plat à base de baleine” sont plus rares qu’en Norvège, pays où cet animal peut être consommé. Et inversement que les requêtes sur le pastis sont rarissimes en Norvège

sansmotif le 24/05/2020 à 15:23

Y’a pas que les variables cachées, y’a surtout le fait qu’ils ne confondent pas corrélation et causalité / démonstration:

C’est pas parque y’a corrélation entre 2 données sur un interval de temps donné que ça signifie quoi que soit concernant un rapport entre ces données…

Fastlink le 25/05/2020 à 11:49

Disons qu’on aime que son opinion soit confortée en continu donc quelques piqures de rappel (meeting, recherche sur le web par exemple) ne font pas de mal.

Je n’y crois pas trop non plus mais je disais ça non pas pour les personnes s’informent de ce qu’il y a à coté mais si elles veulent du “changement” comme on dit pour voir les forces en présence et se renseigner sur elles.
Au bout d’un moment t’as fait le tour donc si tu envisages de voter pour quelqu’un d’autre, en éliminant les 2/3 partis au pouvoir depuis quelques mandats, il reste plus grand monde. C’est moins valable pour des élections plus locales.