Google DeepMind vient de révéler avoir diffusé des structures de protéines liées au coronavirus SARS-CoV-2. Cela peut accélérer certains pans de l'effort international pour trouver des solutions médicales à la crise.

Tandis que les épidémies liées à Covid-19 se multiplient et s’intensifient, tout en restant cela dit sous contrôle grâce à des mesures de quarantaine, l’effort international pour trouver des solutions médicales ne tarit pas. De nombreuses caractéristiques du coronavirus SARS-CoV-2, qui provoque cette maladie, restent floues pour les chercheurs. La réponse sur sa transmissibilité est, par exemple, bien loin d’être encore tranchée. En 2020, on peut cela dit compter sur une aide précieuse : l’intelligence artificielle (ou en tout cas, des algorithmes perfectionnés).

L’entreprise britannique DeepMind, appartenant à Google, a justement révélé le 5 mars 2020 avoir mobilisé ses ressources pour décrypter le coronavirus, tout particulièrement ses protéines. Fin 2019, DeepMind avait annoncé AlphaFold, un système à base d’IA capable de prédire les structures des protéines. « Les modèles 3D de protéines que AlphaFold génère sont bien plus précis que tout ce qui était fait avant — ce qui marque un progrès significatif dans l’un des défis centraux de la biologie », annonçait alors DeepMind. C’est sur ce système novateur que sont basées les actuelles prédictions publiées par l’entreprise.

Voici à quoi ressemble la modélisation de la structure des protéines du coronavirus par AlphaFold. // Source : AlphaFold / DeepMind

AlphaFold n’a pas besoin de structure similaire pour ses prédictions

Depuis janvier, le génome du coronavirus a été séquencé, puis diffusé gratuitement, en accès libre, auprès de la communauté scientifique. C’est ce qui offre aux chercheurs la possibilité d’explorer sa structure. Des universités espéraient d’ailleurs récemment trouver la clé d’un vaccin dans la « protéine en forme de flèche » de Sars-Cov-2, car celle-ci permet au virus de pénétrer dans les cellules vivantes pour s’y répliquer. Les protéines représentent, de manière générale, une partie essentielle de la vie : si on veut percer à jour le coronavirus, alors il faut modéliser et comprendre autant que possible ses protéines.

Raison pour laquelle DeepMind annonce participer à l’effort scientifique collectif en partageant en libre accès des structures protéinaires prédites par son IA. Comme le précise l’entreprise, ce sont qui plus est des protéines encore peu étudiées par les laboratoires. Les structures produites via AlphaFold n’ont pas été testées en laboratoire, et l’algorithme est encore expérimental. DeepMind précise donc qu’en temps normal, l’entreprise aurait attendu une révision par les pairs avant de diffuser les résultats. Mais compte tenu de l’urgence de la situation, ce critère n’a pas été respecté.

Comprendre la structure des protéines signifie éclaircir les éléments essentiels de leur fonctionnement… sauf que mettre au jour la structure des protéines peut prendre des mois en laboratoire. En temps de crise, il peut s’avérer utile de raccourcir ce délai par une voie algorithmique accélérée. Mais les modélisations existantes en la matière ne fonctionnent qu’en se basant sur la prédiction à partir de structures similaires. Or, l’actuel coronavirus présente quelques nouveautés, même s’il appartient à une famille connue. Les scientifiques sont ralentis par ces nouveautés. C’est là où AlphaFold a un intérêt : il n’a pas besoin de se baser sur des structures connues pour prédire la structure des protéines qu’il analyse. Comme l’indique l’entreprise, c’est de la « modélisation libre ».

Malgré le facteur encore expérimental de son IA, DeepMind semble confiant et assure que les structures prédites «  peuvent contribuer à l’interrogation de la communauté scientifique sur le fonctionnement du virus, et servir de plate-forme pour établir des pistes de futurs travaux expérimentaux visant à développer des traitements ».

Crédit photo de la une : AlphaFold

Partager sur les réseaux sociaux