Ce n'est pas un pic de contaminations, mais bien une réactualisation des données réparties du 13 au 28 mai.

Si vous suivez avec attention les chiffres de l’épidémie en France, directement dans Google ou via Covid-Tracker par exemple, vous avez peut-être été surpris de constater ce vendredi 29 mai une évolution soudaine dans la courbe pour le 28 mai : un bond dans le chiffre de l’infection, passant de 191 nouveaux cas la veille à 3 325 nouveaux cas.

Étant donné qu’aucune deuxième vague n’a lieu en ce moment, ce chiffre peut étonner. Mais il ne montre pas de pic lié au déconfinement. Il est le résultat d’une évolution dans la comptabilisation de la maladie. En effet, contactée par Numerama, la Direction générale de la Santé nous a indiqué qu’il s’agit du résultat de la «  nouvelle surveillance » qu’est l’intégration du système de données SI-DEP. Cette nouvelle base de données centralisée permet « depuis le 13 mai, une estimation du nombre de cas confirmés en France grâce à la transmission des données de la part de tous les laboratoires de ville et des laboratoires hospitaliers ».

Les 3 325 cas ajoutés ce 29 mai à la date du 28 mai sont donc des cas détectés dans ces laboratoires entre le 13 mai et le 28 mai, comme nous le précise la DGS. Cela fait en moyenne 200 cas par jour sur cette période. Il n’y a donc toujours aucun nouveau pic à l’heure actuelle, contrairement à ce que ce chiffre obscur de prime abord peut faire croire. Il s’agit simplement une réactualisation de données manquantes, toutes ajoutées le même jour. Qui aurait peut-être dû être lissée afin de mieux correspondre aux faits.

Graphique affichée dans Google des nouveaux cas de coronavirus en France. Le bond affiché le 29 mai au sujet du 28 mai n’est pas un pic mais une réactualisation.

Un manque de transparence ?

Ce bond dans les chiffres, qui ne retranscrit pas un bond des infections mais une subtilité de comptabilisation, est un bon exemple que des chiffres ont toujours besoin d’une contextualisation : leur source, leur signification, leur proportion par rapport à ce qui est connu ou non.

D’ailleurs, pour le data scientist Guillaume Rozier qui est à l’origine de Covid-Tracker, la crise actuelle pose un véritable problème de transparence des données. Lorsque nous l’avons contacté, avant que la DGS ne nous donne l’information, il nous a indiqué qu’il ne pouvait pas analyser d’où venaient cet étonnant chiffre de 3 325 cas : «  impossible de savoir », en l’absence de communication régulière sur l’intégralité des données.

« Hier, le gouvernement a présenté 2 nouveaux indicateurs (servant à générer la carte de synthèse vert/rouge) ainsi que l’évolution du R effectif. Absolument aucune donnée n’est publique concernant ces deux cartes et ce graphique. Donc on n’a absolument aucun moyen de vérifier, recalculer les indicateurs, etc. », a-t-il ensuite ajouté pour illustrer ce manque de transparence.

Partager sur les réseaux sociaux