Le créateur du site CovidTracker, Guillaume Rozier, a renoncé à son propre accès exclusif aux données de la vaccination pour rappeler que ce n'est pas à lui de faire le relai de ces informations précieuses : elles doivent être accessibles, chaque jour, à tout le monde.

Combien de personnes ont-elles reçu le vaccin contre le coronavirus en France ? Il est bien difficile, en ce début 2021, d’obtenir une réponse précise à cette question au jour le jour. Le gouvernement donne bien les chiffres, mais essentiellement lors de conférences de presse. Ces données ne sont pas accessibles librement, avec une publication quotidienne, comme il en va pour le nombre de cas positifs ou de tests de dépistage. Depuis le début de la campagne, c’est le site CovidTracker qui essaye de dépeindre le plus fréquemment possible la situation chiffrée, à partir de données que le ministère transmettait alors en exclusivité à Guillaume Rozier, fondateur du site, seul endroit où l’on pouvait retrouver régulièrement les statistiques les plus à jour.

Pourtant, le matin du lundi 11 janvier, Guillaume Rozier a annoncé sur son compte Twitter qu’il ne se basera plus sur ces informations de première main. Dans le but de défendre un modèle open data, CovidTracker se reposera désormais seulement sur les données officiellement publiées, c’est-à-dire des données très parcimonieuses, car la France n’a pas encore adopté de stratégie open data concernant les chiffres de la vaccination. Contacté par Numerama, Guillaume Rozier nous a expliqué plus en détail sa démarche.

Mise à jour, 12 janvier 2021 : le gouvernement semble avoir entendu l’appel, car l’open data est dorénavant enclenchée avec une publication quotidienne des données relatives à la vaccination.

L’intérêt de l’open data pour donner du sens

La France reste plutôt bon élève en matière d’open data au fil de la pandémie, nous rappelle au cours de la conversation le créateur de CovidTracker. « Je ne me plains pas : on a des données relativement complètes, avec l’essentiel, de manière transparente, fiable, quotidienne : les tests, le nombre cas par tranche d’âge, par département, par région… tout cela sur data.gouv, un site officiel. » Tout n’est pas parfait pour autant, note Guillaume Rozier. Il n’a jamais réussi à obtenir la part de tests antigéniques et la part de tests PCR dans le taux positivité, par exemple, alors que cette information existe, et que les deux dépistages n’ont pas la même fiabilité. La transparence n’est donc pas parfaite, il y a des éléments à améliorer, mais elle reste globalement au rendez-vous sur les indicateurs majeurs.

Il est donc d’autant plus dommageable que cette transparence ne s’applique pas aux statistiques vaccinales. Car l’open data est utile en temps de pandémie. Le libre accès aux données permet en effet à la communauté statistique de palier ce que l’État ne fait pas, à savoir « proposer de la visualisation de données, des outils qui ajoutent du sens », nous indique Guillaume Rozier. Ce sont des repères importants pendant une crise sanitaire, pendant laquelle la population peut se sentir dépassée par l’afflux informatif. Cette mise en sens «  est gratuite  », pointe Guillaume Rozier, car dans ce type d’activités numériques, indépendantes, la communauté de la data n’est pas rémunérée par le gouvernement ni reliée à lui. Une forme d’échange informel se met en place.

Exemple d’outil d’analyse sur VaccinTracker, l’app de suivi de la campagne vaccinale créée par Guillaume Rozier. // Source : CovidTracker

En revanche, il y a une chose que ces statisticiens ne peuvent clairement pas faire : recueillir les informations qu’ils interprètent. Ils ont besoin que le gouvernement les diffuse de prime abord. « Personne d’autre que l’État ne peut collecter les données, alors sans l’open data, personne ne peut rien faire. » C’est aussi et surtout pour cette raison que Guillaume Rozier a souhaité ne plus diffuser les données en exclusivité : éviter qu’au long terme, cela génère une ambiguïté. Il souhaitait garder son indépendance d’analyse. Étant donné qu’il n’est pas impliqué dans leur collecte, « ce n’est pas à moi de les publier, je n’en suis pas responsable », insiste-t-il. « Elles devraient être publiques, accessibles à tous. »

La base de données VAC-SI est stabilisée

Aujourd’hui, l’open data pour les chiffres de la vaccination serait techniquement possible, puisque la base de données VAC-SI a été rendue opérationnelle le 4 janvier 2021. « VAC-SI est stabilisée, l’open data est prête, alors si ce n’est pas en place, c’est une décision politique », relève Guillaume Rozier. Le gouvernement explique pourtant l’absence d’open data par des contraintes techniques : cela prend du temps à mettre en place sans risquer des aléas informatiques. Un obstacle que le créateur de CovidTracker comprend en tant qu’ingénieur en informatique lui-même, mais qui serait toutefois dépassable selon lui.

«  Je ne demande pas un open data parfait dès le premier jour, tempère Guillaume Rozier auprès de Numerama, je demande juste une publication des données  : un tweet, ou même un simple fichier Excel publié sur le site du gouvernement… mais que ce soit public, car ils ont une estimation du nombre de personnes vaccinées par jour. »

La décision de CovidTracker de ne plus utiliser son propre accès exclusif relève donc d’un message pacifique — mais engagé — envoyé au gouvernement : pour le bien commun, les données de la vaccination doivent être librement accessibles, comme toutes les autres données, le plus rapidement possible.

Crédit photo de la une : Markus Spiske / Unsplash

Partager sur les réseaux sociaux

La suite en vidéo