Vaccins : pourquoi la France doit publier les données au quotidien
Combien de personnes ont-elles reçu le vaccin contre le coronavirus en France ?
Pourtant, le matin du lundi 11 janvier, Guillaume Rozier a annoncé sur son compte Twitter qu'il ne se basera plus sur ces informations de première main. Dans le but de défendre un modèle open data, CovidTracker se reposera désormais seulement sur les données officiellement publiées, c'est-à-dire des données très parcimonieuses, car la France n'a pas encore adopté de stratégie open data concernant les chiffres de la vaccination. Contacté par Numerama, Guillaume Rozier nous a expliqué plus en détail sa démarche.
Mise à jour, 12 janvier 2021 : le gouvernement semble avoir entendu l'appel, car l'open data est dorénavant enclenchée avec une publication quotidienne des données relatives à la vaccination.
L'intérêt de l'open data pour donner du sens
La France reste plutôt bon élève en matière d'open data au fil de la pandémie, nous rappelle au cours de la conversation le créateur de CovidTracker. « Je ne me plains pas : on a des données relativement complètes, avec l'essentiel, de manière transparente, fiable, quotidienne : les tests, le nombre cas par tranche d'âge, par département, par région... tout cela sur data.gouv, un site officiel. » Tout n'est pas parfait pour autant, note Guillaume Rozier. Il n'a jamais réussi à obtenir la part de tests antigéniques et la part de tests PCR dans le taux positivité, par exemple, alors que cette information existe, et que les deux dépistages n'ont pas la même fiabilité. La transparence n'est donc pas parfaite, il y a des éléments à améliorer, mais elle reste globalement au rendez-vous sur les indicateurs majeurs.
Il est donc d'autant plus dommageable que cette transparence ne s'applique pas aux statistiques vaccinales. Car l'open data est utile en temps de pandémie. Le libre accès aux données permet en effet à la communauté statistique de palier ce que l'État ne fait pas, à savoir « proposer de la visualisation de données, des outils qui ajoutent du sens », nous indique Guillaume Rozier. Ce sont des repères importants pendant une crise sanitaire, pendant laquelle la population peut se sentir dépassée par l'afflux informatif. Cette mise en sens « est gratuite », pointe Guillaume Rozier, car dans ce type d'activités numériques, indépendantes, la communauté de la data n'est pas rémunérée par le gouvernement ni reliée à lui. Une forme d'échange informel se met en place.
En revanche, il y a une chose que ces statisticiens ne peuvent clairement pas faire : recueillir les informations qu'ils interprètent. Ils ont besoin que le gouvernement les diffuse de prime abord. « Personne d'autre que l'État ne peut collecter les données, alors sans l'open data, personne ne peut rien faire. » C'est aussi et surtout pour cette raison que Guillaume Rozier a souhaité ne plus diffuser les données en exclusivité : éviter qu'au long terme, cela génère une ambiguïté. Il souhaitait garder son indépendance d'analyse. Étant donné qu'il n'est pas impliqué dans leur collecte, « ce n'est pas à moi de les publier, je n'en suis pas responsable », insiste-t-il. « Elles devraient être publiques, accessibles à tous. »
La base de données VAC-SI est stabilisée
Aujourd'hui, l'open data pour les chiffres de la vaccination serait techniquement possible, puisque la base de données VAC-SI a été rendue opérationnelle le 4 janvier 2021. « VAC-SI est stabilisée, l'open data est prête, alors si ce n'est pas en place, c'est une décision politique », relève Guillaume Rozier. Le gouvernement explique pourtant l'absence d'open data par des contraintes techniques : cela prend du temps à mettre en place sans risquer des aléas informatiques. Un obstacle que le créateur de CovidTracker comprend en tant qu'ingénieur en informatique lui-même, mais qui serait toutefois dépassable selon lui.
« Je ne demande pas un open data parfait dès le premier jour, tempère Guillaume Rozier auprès de Numerama, je demande juste une publication des données : un tweet, ou même un simple fichier Excel publié sur le site du gouvernement... mais que ce soit public, car ils ont une estimation du nombre de personnes vaccinées par jour. »
La décision de CovidTracker de ne plus utiliser son propre accès exclusif relève donc d'un message pacifique -- mais engagé -- envoyé au gouvernement : pour le bien commun, les données de la vaccination doivent être librement accessibles, comme toutes les autres données, le plus rapidement possible.