Publié par Guillaume Champeau, le Vendredi 17 Août 2012

Un livre entier enregistré dans de l'ADN synthétisé

Des chercheurs américains ont réussi à stocker tout un livre dans une séquence d'ADN pesant moins d'un milliardième de gramme. Il n'est cependant pas encore question de transformer le corps humain en support d'enregistrement de données...

C'est peut-être la technologie d'avenir pour le stockage d'immenses quantités de données. Une équipe de recherche dirigée par George Church, un biologiste de synthèse de l'école médicale de Harvard, a publié cette semaine dans la revue Science un article dans lequel elle affirme avoir stocké un livre entier dans un picogramme d'ADN (un milliardième de gramme). 

Dans une cellule, l'ADN est composé de quatre types de molécules, dites nucléotides, qui s'accrochent ensemble pour former un brin. Ces quatre nucléotides forment une espèce d'alphabet de l'ADN, symbolisé par les lettres A (adénine), C (cytosine), T (thymine), et G (guanine). Lorsque l'on parle de séquencer l'ADN, il s'agit donc d'établir la longue suite de nucléotides pour aboutir à une séquence du type : TTCAGTTCGAACTGAACCTGCA...

En 2010, un laboratoire de recherche avait réussi à synthétiser chimiquement le premier ADN complet, assemblé à partir de données numériques (voir cet excellent article d'AxiomCafé qui décrit très bien le procédé), et inséré dans une cellule vivante. Deux ans plus tard, l'équipe de George Church a réalisé le même type d'expérience, mais avec cette fois pour objectif d'utiliser l'ADN pour stocker des informations de façon stable, avec une capacité de stockage inégalée - selon Science, un seul gramme d'ADN peut contenir "des milliards de gigaoctets de données".

Pour réussir leur prouesse, les chercheurs n'ont pas utilisé de cellules vivantes, qui sont trop instables pour assurer l'intégrité des données, mais une imprimante chargée de déposer des fragments d'ADN synthétisé sur une petite surface en verre. A la place du langage binaire (0 et 1) utilisé traditionnellement dans l'informatique, les 5,37 mégaoctets de données du livre de génétique co-écrit par George Church ont été encodés selon l'alphabet de l'ADN, en séquences de A, C, T et G. Chacun des fragments possédait par ailleurs une en-tête permettant d'identifier sa place dans l'ensemble du "fichier". 

A l'aide d'un séquenceur d'ADN (qui n'est pas prêt d'arriver chez monsieur-tout-le-monde), les chercheurs ont alors pu relire les données qu'ils avaient imprimées sous forme d'ADN synthétisé, et les ré-ordonner. Le plus spectaculaire est qu'ils n'ont constaté qu'un taux d'erreurs de 2 erreurs par millions de bits, soit un résultat "équivalent aux DVD et bien meilleur que les disques dur magnétiques".

Publié par Guillaume Champeau, le 17 Août 2012 à 16h00
 
26
Commentaires à propos de «Un livre entier enregistré dans de l'ADN synthétisé»
Inscrit le 23/01/2008
296 messages publiés
excusez moi ca me semblait très pro tout ca... sauf sur la dernière phrase ?
Inscrit le 25/11/2006
1139 messages publiés
les "ayants" droit vont ce précipité pour établir une nouvelle taxe sur ce support "d'enregistrement" diable vu le nombre d'être humains et d'animaux vivant sur la terre; cela représente une sacre cagnotte pour ces vautours .
Inscrit le 27/01/2005
476 messages publiés
Un jour la vie des gens sera raconté directement dans leur ADN, ils auront cette particuarité dès leur naissance xD. Le 7 juillet 3120 à 14h32 et 18 secondes, 157xx45za a levé son bras pendant 2.3 secondes. Tout ça en langage de l'ADN bien sûr.
Inscrit le 18/06/2003
101 messages publiés
Il y a un truc qui m'échappe. Les séquences d'ADN (c'est à dire l'ordre des molécules T,G,C et A si j'ai bien compris) sont bien ordonnées dans un sens logique qui mène à ce que nous sommes biologiquement. Or là il s'agirait (toujours si j'ai bien compris) de créer des brins d'adn à partir de séquences de molécules censées représenter un livre.

Ok soit, mais concrètement, si on insère ces brins d'adn qui ne correspondent à rien de naturel, est-ce qu'il ne risque pas d'y avoir des effets secondaires indésirables sur un être vivant? (Si ça arrive un jour bien sûr)
Inscrit le 20/01/2006
20 messages publiés
Rex au pied, je dois lire mon journal!
Inscrit le 12/07/2008
27 messages publiés
lolopopo, le 17/08/2012 - 17:04
Rex au pied, je dois lire mon journal!

Inscrit le 05/03/2008
923 messages publiés
ethan, le 17/08/2012 - 16:54
Il y a un truc qui m'échappe. Les séquences d'ADN (c'est à dire l'ordre des molécules T,G,C et A si j'ai bien compris) sont bien ordonnées dans un sens logique qui mène à ce que nous sommes biologiquement. Or là il s'agirait (toujours si j'ai bien compris) de créer des brins d'adn à partir de séquences de molécules censées représenter un livre.

Ok soit, mais concrètement, si on insère ces brins d'adn qui ne correspondent à rien de naturel, est-ce qu'il ne risque pas d'y avoir des effets secondaires indésirables sur un être vivant? (Si ça arrive un jour bien sûr)


Non. Tout dans l'ADN n'est pas interprété, les télomères par ex sont les extremités de nos chromosomes qui ne sont pas lu (ils servent de "tampon" pour la division cellulaire qui a la facheuse tendance à "casser" les extrémités des chromosomes). Pour l'ADN soit interprété il faut qu'il commence par un codon de démarrage bien précis : UUG, AUG ou GUG. Il suffit d'interdire ce codon dans l'alphabet d'encodage (cf. les travaux de Shanon) pour résoudre le problème
[message édité par lildadou le 17/08/2012 à 17:50 ]
Inscrit le 18/06/2003
101 messages publiés
lildadou, le 17/08/2012 - 17:50
Non. Tout dans l'ADN n'est pas interprété, les télomères par ex sont les extremités de nos chromosomes qui ne sont pas lu (ils servent de "tampon" pour la division cellulaire qui a la facheuse tendance à "casser" les extrémités des chromosomes). Pour l'ADN soit interprété il faut qu'il commence par un codon de démarrage bien précis : UUG, AUG ou GUG. Il suffit d'interdire ce codon dans l'alphabet d'encodage (cf. les travaux de Shanon) pour résoudre le problème


Merci pour l'explication
Inscrit le 03/10/2011
6620 messages publiés
Malgré tout, je me demande quel peut être la durée de vie d'un tel brin d'ADN.
Gageons que l'année prochaine, on pourra encore lire le livre.

Maintenant, il va falloir réduire tout ça pour des applications pratiques, je n'imagine pas avoir toute ma bibliothèque et ma vidéothèque dans une boite de 1 mm3, et en même temps avoir un lecteur de 100 m3 pour stocker les laborantins, le séquenceur, un duplicateur ? (on suppose qu'on veut pouvoir lire le livre plus d'une fois et pas qu'il soit détruit à la lecture), en espérant que je puisse voir la fin du film dans moins d'une semaine.
Inscrit le 16/03/2009
863 messages publiés
Finalement, on finira bien par l'avoir, notre Pip-Boy...



Plus sérieusement, si sur une surface aussi ridicule, on peut faire tenir plus qu'un serveur de données peut contenir, à voir comment cela peut être appliqué.

Projetons-nous un peu (pas trop loin et gaffe à l'atterrissage). Si les scientifiques parviennent à créer une machine permettant de lire et d'écrire sur base d'ADN, que le langage informatique de base n'est plus le binaire mais la séquence ADN, cela ouvrirait de toutes nouvelles possibilités pour l'informatique. Imaginons également que ce langage se révèle plus performant que le binaire. Les applications physiques (un disque dur de plusieurs tera de la taille d'une clé WiFi, donc environ 2cm de long pour 1cm de large). Quoi qu'il faut voir la taille et l'énergie consommée de la machine permettant de lire cette séquence ADN...



Par contre, pour les ayant-droits, ce serait un vrai calvaire. Du piratage de masse sur des outils microscopiques et qui seraient plus que difficiles à déceler sur une personne... Un type qui aurait plusieurs teraoctets de données sur lui, sans qu'il soit possible de déceler OU...
[message édité par Demian le 17/08/2012 à 19:52 ]
Inscrit le 27/05/2005
74 messages publiés
Je ne vois pas l'intérêt d'avoir choisi l'ADN, autre que "pour le faire".

Si il est possible de transcoder autant d'informations sous forme d'ADN, il est tout autant possible de le faire sous une autre forme, prenant aussi peu d'espace et permettant un accès bien plus simple.

Finalement, les chercheurs ont simplement créé un codec permettant de convertir du code ASCII en composants de l'ADN. Ne reste que la nécessité d'avoir un séquenceur qui produira physiquement ces composants, et les lira pour les reconvertir en données numériques, puis le codec fera le travail en sens inverse, pour retrouver de l'ASCII.
C'est très certainement réducteur du travail accompli, mais je n'ai pas les connaissances pour développer.

Néanmoins, à part pour réutiliser du matériel existant (séquenceurs ADN), et la publicité, quel est l'intérêt de choisir de l'ADN?

Il est possible de le faire sous forme de molécules tout à fait différentes, voir même de choisir un support physique totalement différent.
Inscrit le 10/06/2005
6355 messages publiés
ze_katt (Modérateur(rice)) le 17/08/2012 à 20:26
Heu, soit c’est un picogramme soit c'est un un milliardième de gramme,
mais ca ne peut pas être les deux.

http://fr.wiktionary...wiki/picogramme
Inscrit le 17/08/2012
2 messages publiés
Je ne vois pas l'intérêt d'avoir choisi l'ADN, autre que "pour le faire".

Si il est possible de transcoder autant d'informations sous forme d'ADN, il est tout autant possible de le faire sous une autre forme, prenant aussi peu d'espace et permettant un accès bien plus simple.

Finalement, les chercheurs ont simplement créé un codec permettant de convertir du code ASCII en composants de l'ADN. Ne reste que la nécessité d'avoir un séquenceur qui produira physiquement ces composants, et les lira pour les reconvertir en données numériques, puis le codec fera le travail en sens inverse, pour retrouver de l'ASCII.
C'est très certainement réducteur du travail accompli, mais je n'ai pas les connaissances pour développer.

Néanmoins, à part pour réutiliser du matériel existant (séquenceurs ADN), et la publicité, quel est l'intérêt de choisir de l'ADN?

Il est possible de le faire sous forme de molécules tout à fait différentes, voir même de choisir un support physique totalement différent.


le defi n'est pas de faire un livre mais de controller l'ecriture et la lecture d'information sur un support génétique. C'est de la science pur. ce résultat semble petit, mais il temoigne d'une maitrise des processus.
Il appartien ensuite a chacun d'exploiter ce savoir faire en medecine (therapie genique; ecriture de gene), en informatique creation de support de stockage vivant; l'interet est la longue durée de vie (plusieurs decenies siècles).
Inscrit le 10/06/2005
6355 messages publiés
ze_katt (Modérateur(rice)) le 17/08/2012 à 21:28
Le stockage sur du vivant durera le temps de vie du support.
Inscrit le 17/08/2012
2 messages publiés
Travaillant en génétique, je me permet de répondre à SinDromX.
Les technologies employées par ces scientifiques sont connues depuis de nombreuses années, mais sont extrêmement coûteuses. Comptez 500k? juste pour le séquenceur à ADN, je pourrais vous chiffrer tout le matériel ainsi que le coût humain/compétence dans le détail mais ce n'est pas mon propos.

En contrepartie, il existe des technologie en génétique très peu coûteuse, fiable et simple, je donne comme exemple l'amplification par PCR.
D'une séquence d'ADN, on peut en générer 10^6 en quelques heures.
Les possibilités de stockage de l'ADN sont gigantesques, les perspectives en terme de cryptage et sécurité des données pourraient être révolutionnaires.

Le rapprochement de la biologie et de l'informatique est relativement récent, mais les technologies progressent vite. Dans le jargon biologique, il est maintenant admis qu'après la biologie in vitro, nous entrons dans l'ère du "in silico".

Si maintenant l'informatique se tourne également vers la biologie, on peut espérer de grandes avancées dans le biologie médicale. C'est avec ce genre de technologie que les chercheurs rêvent de remédier aux maladies génétiques.

Ecrire/Lire un livre peut paraître futile, mais la recherche a aussi besoin de ce genre de coup marketing.
Inscrit le 21/03/2009
1777 messages publiés
ze_katt, le 17/08/2012 - 21:28
Le stockage sur du vivant durera le temps de vie du support.



Le stockage sur n'importe quel support dure le temps de vie du support.

A noter que la notion de "durée de vie" pour l'ADN est celle de la grosse molécule, qui peut être plus longue que le durée de vie de l'entité biologique qui contient l'ADN (si elle existe...)
[message édité par identifiant le 17/08/2012 à 21:50 ]
Inscrit le 10/06/2005
6355 messages publiés
ze_katt (Modérateur(rice)) le 17/08/2012 à 21:50
Ou pas, ca dépend de la loterie de la transmission de gènes.
Inscrit le 21/03/2009
1777 messages publiés
ze_katt, le 17/08/2012 - 21:50
Ou pas, ca dépend de la loterie de la transmission de gènes.


Tu parles de la reproduction ?
Que va t-elle devenir ?
Si l'ADN sert à enregistrer des données, l'acte de reproduction sera probablement redéfinis comme un acte de contrefaçon et donc interdit...

/discuss
[message édité par identifiant le 17/08/2012 à 21:53 ]
Inscrit le 10/06/2005
6355 messages publiés
ze_katt (Modérateur(rice)) le 17/08/2012 à 21:54
Ben l'ADN n'existe pas ex nihilo dans l’atmosphère jusqu’à preuve du contraire.
Inscrit le 03/11/2008
565 messages publiés
le film johnny mnémonic devient d'actualité on dirait
Inscrit le 05/03/2008
923 messages publiés
SinDromX, le 17/08/2012 - 20:23
Je ne vois pas l'intérêt d'avoir choisi l'ADN, autre que "pour le faire".

Si il est possible de transcoder autant d'informations sous forme d'ADN, il est tout autant possible de le faire sous une autre forme, prenant aussi peu d'espace et permettant un accès bien plus simple.

Finalement, les chercheurs ont simplement créé un codec permettant de convertir du code ASCII en composants de l'ADN. Ne reste que la nécessité d'avoir un séquenceur qui produira physiquement ces composants, et les lira pour les reconvertir en données numériques, puis le codec fera le travail en sens inverse, pour retrouver de l'ASCII.
C'est très certainement réducteur du travail accompli, mais je n'ai pas les connaissances pour développer.

Néanmoins, à part pour réutiliser du matériel existant (séquenceurs ADN), et la publicité, quel est l'intérêt de choisir de l'ADN?

Il est possible de le faire sous forme de molécules tout à fait différentes, voir même de choisir un support physique totalement différent.

On sait stocker sous plein de forme différentes mais chacune à des avantages et des
inconvénients. C'est pour cela qu'il y a de la mémoire dans les processeurs, la RAM, des disques durs, des disque solid-state, etc
Stocker sur ADN permet d'atteindre une densité de donnée
extrêmement
élevé au prix d'un accès très lent (excepté
la duplication, le hashage, la recombinaison car il est existe des enzymes). Toi ça ne t'intèresse pas mais ça peut
intéresser
d'autres secteurs ;
notamment
l'archivage.
La question de la qualité du support est un faux problème. Démonstration: on sait coder de l'information pour qu'elle soit tolérante aux pannes en contrepartie d'un peu plus consommation de mémoire. Comme le cout de la mémoire sur ADN est très faible alors le coup de la tolérance est aussi très faible. Le stockage sur ADN est en effet très résistant aux erreurs. Il suffit de coder l'information avec un bon taux de tolérance (au cas où l'écriture flanche) et on duplique des millions de fois l'écriture pour pas un rond.
Inscrit le 17/08/2012
2 messages publiés
A noter, l'ADN se stocke très bien en isopropanol à -40°C, c'est une molécule extrêmement stable qui ne bougera plus une fois au congélateur.

Les molécules d'ADN résistent à l'air ambiant, il n'y a pas besoin de support cellulaire pour travailler dessus.

Je bosse dessus tout les jours, c'est mon métier
Inscrit le 30/03/2011
49 messages publiés
J'ai déja vu ça dans Ilium et Olympos de Dan Simmons, plus que la TQ ou le Fax et ça sera parfait !
Inscrit le 09/05/2012
148 messages publiés
Voilà un nouveau support pour les sciences-fictions les plus délirantes.
C'est l'histoire d'un livre maudit qui n'aurait jamais dû être numérisé sur ADN, car ... blabla blabla + ADN d'un microbe + ADN ... => un truc inimaginable!
Inscrit le 08/08/2012
1857 messages publiés
L'avancée est intéressante, mais quand on a joué à Cyberpunk (vu des films ou lu des bouquins du genre), ça commence un peu à foutre les jetons ! O_o
Inscrit le 27/09/2012
2 messages publiés
Si [...] le langage informatique de base n'est plus le binaire mais la séquence ADN, cela ouvrirait de toutes nouvelles possibilités pour l'informatique. Imaginons [...] que ce langage se révèle plus performant que le binaire.


T'emballes pas ! Binaire = base 2 ; ADN = base 4 ; 4=2^2 => un caractère en base 4 correspond à une chaîne de 2 caractères en binaire.

Donc la conversion binaireADNhéxadécimale est évidente !

On part sur A=0 (00 en binaire); T=1 (01); C=2 (10); G=3 (11)

Ex : (0)11100101011010010
On découpe en deux : 01 11 00 10 10 11 01 00 10
Soit : 1 3 0 2 2 3 1 0 2
Soit TGACCGTAC (on le fait bien plus vite sans expliquer).
(remplacer T par U en ADNr)

Autre sens : GATTACA -> 11000101001000

Pour l'héxa : AA=0; AT=1; AC=2; AG=3; TA=4; TT=5; TC=6; TG=7; CA=8; CT=9; CC=A; CG=B; GA=C; GT=D; GC=E; GG=F d'où GATTACA= AG AT TA CA (on peut bien sûr rajouter "0" devant un nombre)= 3148.

Il ne peut donc pas être plus performant, mais autant.

Le complément à 2 devient un complément à 4 :
-5 = -(0101) = 1010 + 0001 = 1011
= -(TT) = CC + AT = CG (GG-TT=CC ; CC+AT=CG)

D'où 10-5= 1010 - 0101 = 1010 + 1011 = 0101 = 5
= C C - T T = C C + C G = T T = 5

Bref - tout ce qu'on connaît avec le binaire marche avec la base 4.
Répondre

Tous les champs doivent être remplis.

OU

Tous les champs doivent être remplis.

FORUMS DE NUMERAMA
Poser une question / Créer un sujet
vous pouvez aussi répondre ;-)
Numerama sur les réseaux sociaux
Août 2012
 
Lu Ma Me Je Ve Sa Di
30 31 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 1 2
3 4 5 6 7 8 9