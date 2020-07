La biotechnologie du stockage ADN n'est pas nouvelle, mais elle est encore loin d'être utilisable en raison de toutes les erreurs que cela génère. Une équipe de chercheurs a développé un algorithme capable de stabiliser le processus.

Lorsque vous achèterez votre prochain disque dur, pensez à ceci : qu’importe le nombre de téraoctets que vous choisirez, votre corps est de toute façon plus puissant encore. Une équipe de chercheurs américains vient justement de réaliser une percée importante dans le « stockage ADN », en codant le livre Le Magicien d’Oz dans du matériel génétique avec une efficace inédite. Les résultats de l’expérience sont publiés en juillet 2020 dans la revue Proceedings of the National Academy of Sciences.

Le principe de pouvoir coder des informations dans l’ADN est loin d’être une nouveauté (la première expérience remonte à 1988), et on sait que le matériel génétique est des millions de fois plus puissant que n’importe quel espace de stockage créé par l’être humain. À l’échelle du stockage ADN, on pourrait faire tenir l’intégralité d’Internet dans l’équivalent d’une boîte à chaussures ; là où il nous faut aujourd’hui des kilomètres de datacenters.

Après tout, il s’agit littéralement d’un stockage développé au fil de millions d’années par l’évolution naturelle. L’idée d’utiliser le stockage ADN comme biotechnologie « tire parti de ce que la biologie fait depuis des milliards d’années : stocker beaucoup d’informations dans un espace très restreint qui dure longtemps, expliquent les chercheurs. L’ADN ne prend pas beaucoup de place, il peut être stocké à température ambiante, et il peut durer des centaines de milliers d’années. »

L’algorithme crée un maillage dans l’ADN

Ces dernières décennies, l’ingénierie génétique pour développer un stockage ADN utilisable a fait face à un obstacle : le matériel génétique génère de nombreuses erreurs. L’ADN est soumis à des mutations, qui vont alors toucher l’information qu’on y stocke. C’est là que des erreurs vont s’insérer, en supprimant ou remplaçant des données. L’information que l’on a stockée au sein de l’ADN en devient compromise. Pour illustrer, A-B-C-D-E pourrait se transformer en E-B-D. On fait difficilement plus problématique si l’on veut stocker un document texte, par exemple, puisque le décodage donnera quelque chose qui n’a aucun sens.

C’est là où le travail des chercheurs, dans l’étude récemment publiée, relève d’une importante avancée. Ils ont réussi à stocker de l’information avec une fiabilité et une efficacité jamais vues jusqu’alors. « La principale avancée est un algorithme d’encodage qui permet de retrouver les informations avec précision, même lorsque les brins d’ADN sont partiellement endommagés pendant le stockage », expliquent les auteurs quand ils commentent leurs travaux.

« Nous avons essayé de résoudre autant de problèmes que possible en même temps »

Les bioingénieurs décrivent leur algorithme comme une sorte de maille robuste, où chaque morceau d’information renforce les autres morceaux d’information. Ils ont également identifié les portions d’ADN les plus sujettes à mutations, afin de les écarter lors du processus de stockage. L’algorithme s’adapte par ailleurs au type d’information codée : une virgule oubliée dans un roman est moins grave qu’un 0 oublié dans une déclaration d’impôt, alors l’algorithme renforcera tel ou tel morceau dans le maillage en fonction de ce qui est stocké.

Pour tester leur invention, les scientifiques ont codé le roman Le Magicien d’Oz dans du matériel génétique. Résultat : même si le document a subi quelques erreurs mineures, ils ont pu le décoder en entier sans aucun problème. « Nous avons essayé de résoudre autant de problèmes que possible en même temps. Ce que nous avons obtenu est assez remarquable », s’est réjoui l’un des auteurs de cette innovation biotechnologique.

