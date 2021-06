L'ADN permet de stocker d'immenses quantités d'information sur de tout petits volumes, sans consommer d'énergie. Plusieurs défis techniques restent cependant à relever pour démocratiser ce procédé. Une découverte du MIT vient d'en solutionner un, en fournissant une méthode pour récupérer plus facilement un fichier précis.

Utiliser l’ADN pour stocker nos données, l’idée peut sembler étrange. En réalité, cette technologie a un potentiel énorme : l’ADN peut abriter d’immenses quantités d’informations sur de tout petits volumes, sans consommer d’électricité. Le secteur vient de réaliser une avancée majeure. Des scientifiques du MIT ont développé une technique pour simplifier la récupération de données précises stockées dans l’ADN. Ils ont présenté leurs résultats dans une étude publiée le 10 juin sur Nature Materials.

« Chaque fichier est encapsulé dans une particule de silice de 6 micromètres. Cette particule est labellisée au moyen d’une courte séquence ADN qui révèle le contenu stocké dedans », explique le MIT. L’équipe de scientifiques a démontré qu’elle pouvait récupérer sans erreur une image individuelle dans une séquence ADN contenant 20 images. Compte tenu du nombre de labels qu’il est possible de créer, les chercheurs estiment qu’il sera possible d’utiliser cette technique sur des séquences contenant jusqu’à 1 020 fichiers.

Récupérer une image stockée dans l’ADN

Cette découverte est importante, car elle règle un des problèmes majeurs dans ce domaine. Jusqu’à présent les fichiers stockés sur de l’ADN étaient récupérés grâce à une réaction en chaine par polymérase. Cette technique a cependant deux gros inconvénients : elle fait parfois ressortir d’autres fichiers que ceux recherchés, et surtout elle consomme la plupart de l’ADN de la dose. « C’est un peu comme si vous mettiez le feu à la botte de foin pour retrouver l’aiguille », souligne le professeur d’ingénierie biologique du MIT, Mark Bathe.

La méthode mise au point par son équipe permet, elle, de récupérer un fichier sans endommager le reste de l’ADN — qui pourra ainsi être de nouveau stocké. Il est même possible, grâce à ce procédé, d’utiliser des logiques booléennes pour sélectionner un fichier : en recherchant par exemple « président ET 18e siècle », l’usager obtiendra ainsi le fichier relatif à George Washington, tout comme sur Google Images.

Stocker des données sans consommer d’électricité

L’équipe du MIT estime que cette technique d’archivage ADN pourrait servir à stocker des données « froides » comme celles contenues dans des archives, et auxquelles il n’est pas nécessaire d’accéder très fréquemment. Plusieurs défis techniques restent à relever pour viabiliser ce procédé. Synthétiser de l’ADN coûte en effet encore cher. « Écrire 1 million de Gb de données sur de l’ADN coûterait 1 trillion de dollars », souligne ainsi le MIT. Les coûts de ce processus devraient cependant baisser dans les décennies à venir.

Et si les scientifiques parviennent à rendre la technique moins onéreuse, le stockage ADN ouvrira de formidables perspectives. « Sur Terre, il y a en ce moment 10 trillions de Gb de données digitales et chaque jour, les humains produisent 2,5 millions de Gb en emails, photos, tweets et fichiers », explique le MIT. Ces données sont stockées dans d’immenses data center dont la construction et la maintenance coûtent environ 1 milliard de dollars. Ces data center consomment par ailleurs beaucoup d’électricité.

Une tasse d’ADN peut abriter les données de la planète

L’ADN a de nombreux atouts à faire valoir face à eux, car il peut stocker des quantités d’informations bien plus grandes sur un même volume. L’ADN est mille fois plus dense que de la mémoire flash, indique ainsi Mark Bathe. Une tasse de café remplie d’ADN pourrait théoriquement stocker l’intégralité des données de la planète. Autre avantage : « une fois que le polymère ADN est créé, il ne consomme aucune énergie. On peut éditer l’ADN et le stocker pour toujours ».

Les scientifiques ont prouvé qu’ils étaient capables d’encoder des images ou des textes dans de l’ADN. L’information est d’ailleurs stockée de manière assez similaire à celle utilisée par le secteur informatique, qui encode l’information sous forme de 0 et de 1. Avec l’ADN, ce sont les quatre nucléotides (A, T ,G, C) qui servent à encoder les données. « Le G et le C peuvent par exemple être utilisés pour représenter le 0, et le A et le T pour représenter le 1 », explique le MIT.

