Le Royaume-Uni a découvert tardivement 16 000 malades de plus au coronavirus en une semaine, à cause des limites techniques d'un ancien format de fichier (.xls) utilisé par Excel qui n'autorise qu'un nombre relativement limité de colonnes. Cette utilisation de tableur pour effectuer un traçage des contacts efficace a fait naître une polémique outre-Manche.

Vous ne le saviez peut-être pas, mais le tableur Excel comporte un nombre maximal de lignes et de colonnes dans chaque feuille de calcul qui est ouverte. Ces limites sont données par Microsoft dans son support technique : il n’est pas possible d’aller au-delà de 1 048 576 lignes et de remplir plus de 16 384 colonnes. À première vue, cela paraît bien suffisant pour couvrir bon nombre d’usages.

Mais de toute évidence, ces spécifications sont complètement inadaptées pour se lancer dans du traçage des contacts à des fins de suivi épidémiologique. C’est ce dont le Royaume-Uni vient de se rendre compte début octobre, rapportent le Daily Mail et la BBC. Au point même de faire changer la physionomie de l’épidémie outre-Manche, puisque le nombre de malades a bondi ces derniers jours.

Plus exactement, complètent Le Parisien et Ars Technica, le problème semble trouver son origine dans les limites de XLS, un ancien format de fichier utilisé par Excel et daté des années, qui est pris en charge par d’autres tableurs, comme ceux des suites bureautiques OpenOffice ou LibreOffice. Le XLS limite le nombre de lignes à près de 65 000. Au-delà, il ne peut plus enregistrer d’informations.

En principe, le XLS est en train d’être supplanté par un format plus récent, le XLSX, utilisé depuis 2007. Mais il est encore tout à fait possible, en 2020, de manipuler des fichiers avec l’ancienne extension. Avec le XLSX, il est portant possible de dépasser le million de lignes. Cela ne résout pas fondamentalement le problème, mais cela repousse la limite bien plus loin.

Coronavirus Royaume-Uni nouveaux cas
Les nouveaux cas de coronavirus en date du 4 octobre au Royaume-Uni. // Source : Financial Times

16 000 cas hebdomadaires passés sous les radars

Selon le gouvernement britannique et l’agence de santé Public Health England, il y avait 50 786 personnes malades recensées entre le 25 septembre et le 2 octobre. Mais il a été découvert que 15 841 autres individus n’ont pas été enregistrés, à cause d’une mise à jour des données manquée dans Excel — le fichier de suivi était alors trop rempli.

Cela veut dire qu’en moyenne 1 980 malades ont été loupés ces huit jours. Et, donc, les cas contacts de ces malades.

Selon les informations parvenant d’outre-Manche, ce loupé provoque des critiques sur la manière dont le traçage des contacts est opéré. L’usage du tableur de Microsoft pour ce suivi pose aussi question, même s’il est dit qu’un « rafistolage » a été effectué en ne passant plus par une seule feuille de calcul, mais en la divisant en plusieurs autres contenant chacune une liste plus modeste.

À la lecture du compte-rendu dans la presse, qui donne désormais une tout autre teinte à l’épidémie de coronavirus au Royaume-Uni, plusieurs observateurs sur les réseaux sociaux ont fait remarquer qu’il aurait été plus judicieux d’inverser les éléments mis en colonne avec ceux inscrits en ligne (il existe une option automatique pour pivoter ces éléments), ou même d’utiliser une vraie base de données.

Ces réflexions entreront peut-être dans le champ des investigations qui viennent d’être lancées pour éviter que cela ne se reproduise — car cela donne de fait aux autorités, aux médias, aux soignants comme à la population une fausse appréciation de la situation sanitaire et de la rapidité avec laquelle se propage le virus SARS-CoV-2. Et, de fait, cela ne permet pas de prendre des mesures appropriées.

(mise à jour avec de nouvelles précisions sur l’incident du fichier Excel)

Partager sur les réseaux sociaux