Selon une étude publiée dans la revue Science, les prédictions de propagation d'épidémies de grippe par Google seraient largement erronées. Le moteur de recherche surestime ses résultats.

En 2009, Google a lancé un outil qui exploite les volumes massifs de recherches des internautes pour observer ou même prédire la propagation de la grippe dans le monde, pays par pays. Chaque année, Google repère ainsi les variations de popularité de recherches liées à la grippe ("fièvre", "grippe", "courbatures"…), à la fois dans le temps et dans l'espace, pour détecter la montée des recherches de symptômes et suivre leur trajet géographique. Actuellement, 18 pays sont ainsi étudiés.

L'initiative est un prémisse annonciateur de la volonté de Google de se mettre au centre de la médecine prédictive et personnalisée à travers l'exploitation de ses capacités de traitement du Big Data. Le géant américain a lancé le même outil pour suivre l'évolution de la dengue, et d'autres suivront probablement dans les prochains mois ou les prochaines années. L'intérêt de tels outils pour la santé publique est bien sûr très important, et les enjeux sont colossaux pour Google qui espère avoir accès à de plus en plus de données de santé, de plus en plus personnelles, pour proposer ses propres services de diagnostics et de conseils de traitement.

Mais il reste visiblement de grands progrès à faire dans l'analyse statistique. Selon une étude publiée dans la revue Science et relayée par The Register, les prédictions de pics d'épidémie réalisées par Google auraient été fausses pour 100 des 108 semaines écoulées depuis 2011. "La raison est simple : presque tout le monde croit que le moindre rhume est une grippe", résume le site britannique.

Malade imaginaire

"Nous avons remarqué une corrélation étroite entre le nombre d'internautes qui recherchent des termes liés à la grippe et le nombre de personnes présentant les symptômes de cette maladie", explique Google sur son site. "Fort heureusement, les internautes qui recherchent le terme "grippe" ne sont pas tous malades, mais une corrélation se dessine lorsque toutes les requêtes de recherche sont rassemblées

La firme de Mountain View ajoute que les graphiques qu'elle établit sont des "estimations mises en parallèle avec les données de surveillance officielles concernant la grippe" et qu'elles "sont très proches des indicateurs conventionnels de propagation du virus". Elles auraient l'avantage d'être mises à jour "quotidiennement", alors que les données officielles ne le sont souvent qu'une fois par semaine.

Mais la recherche de symptômes sur Internet, ou même la reconnaissance de ces symptômes par un médecin, ne vaut pas une analyse épidémiologique sérieuse. Aux Etats-Unis, moins de 10 % des échantillons testés par les Centres pour le contrôle et la prévention des maladies (CDC) retournent un résultat positif. C'est-à-dire que dans plus de neuf cas sur dix, ce que l'on croit être une grippe n'en était pas une.

Les chercheurs en concluent que Google accorde une trop grande importance aux données de recherches des utilisateurs et à leur croisement, et pas assez aux erreurs d'auto-diagnostic de ces malades en puissance. Ils pensent même que l'outil peut générer un cercle vicieux en faisant croire aux internautes que la grippe est arrivée dans leur région et en les poussant à se croire malades de la grippe lorsqu'ils ont en réalité une maladie bien plus bénigne.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !