Des chercheurs américains ont réussi à stocker tout un livre dans une séquence d'ADN pesant moins d'un milliardième de gramme. Il n'est cependant pas encore question de transformer le corps humain en support d'enregistrement de données...

C'est peut-être la technologie d'avenir pour le stockage d'immenses quantités de données. Une équipe de recherche dirigée par George Church, un biologiste de synthèse de l'école médicale de Harvard, a publié cette semaine dans la revue Science un article dans lequel elle affirme avoir stocké un livre entier dans un picogramme d'ADN (un milliardième de gramme). 

Dans une cellule, l'ADN est composé de quatre types de molécules, dites nucléotides, qui s'accrochent ensemble pour former un brin. Ces quatre nucléotides forment une espèce d'alphabet de l'ADN, symbolisé par les lettres A (adénine), C (cytosine), T (thymine), et G (guanine). Lorsque l'on parle de séquencer l'ADN, il s'agit donc d'établir la longue suite de nucléotides pour aboutir à une séquence du type : TTCAGTTCGAACTGAACCTGCA…

En 2010, un laboratoire de recherche avait réussi à synthétiser chimiquement le premier ADN complet, assemblé à partir de données numériques (voir cet excellent article d'AxiomCafé qui décrit très bien le procédé), et inséré dans une cellule vivante. Deux ans plus tard, l'équipe de George Church a réalisé le même type d'expérience, mais avec cette fois pour objectif d'utiliser l'ADN pour stocker des informations de façon stable, avec une capacité de stockage inégalée – selon Science, un seul gramme d'ADN peut contenir "des milliards de gigaoctets de données".

Pour réussir leur prouesse, les chercheurs n'ont pas utilisé de cellules vivantes, qui sont trop instables pour assurer l'intégrité des données, mais une imprimante chargée de déposer des fragments d'ADN synthétisé sur une petite surface en verre. A la place du langage binaire (0 et 1) utilisé traditionnellement dans l'informatique, les 5,37 mégaoctets de données du livre de génétique co-écrit par George Church ont été encodés selon l'alphabet de l'ADN, en séquences de A, C, T et G. Chacun des fragments possédait par ailleurs une en-tête permettant d'identifier sa place dans l'ensemble du "fichier". 

A l'aide d'un séquenceur d'ADN (qui n'est pas prêt d'arriver chez monsieur-tout-le-monde), les chercheurs ont alors pu relire les données qu'ils avaient imprimées sous forme d'ADN synthétisé, et les ré-ordonner. Le plus spectaculaire est qu'ils n'ont constaté qu'un taux d'erreurs de 2 erreurs par millions de bits, soit un résultat "équivalent aux DVD et bien meilleur que les disques dur magnétiques".

Partager sur les réseaux sociaux

Articles liés