Des vaccins en un temps record grâce à l’intelligence artificielle
Le développement rapide de deux vaccins contre la Covid-19 a été possible grâce aux technologies de l’intelligence artificielle et à la collaboration innovante entre les chercheurs du monde entier, dont des Suisses.
Derrière les défis éthiques de l’intelligence artificielle (IA) se cachent les opportunités d’une technologie qui pourrait révolutionner le monde de la science et résoudre certaines des énigmes les plus complexes de la biologie moderne. La plus importante d’entre elles: la prédiction de la structure de protéines encore inconnues pour percer les secrets des cellules et des maladies qui les affectent.
Déterminer la forme des protéines de manière expérimentale est un processus long et laborieux, qui nécessite des mois de recherche et mobilise beaucoup de ressources. Ces informations sont toutefois essentielles pour étudier les nouveaux virus, comprendre leur comportement et mettre au point des vaccins efficaces. La capacité des scientifiques à prédire la structure des protéines par des méthodes de calcul a rendu ce processus beaucoup plus rapide et précis.
Grâce aux récents progrès de l’intelligence artificielle, il est désormais possible de prédire avec une grande précision les structures tridimensionnelles de protéines cibles très complexes. Une étape importante a été franchie lorsque AlphaFold2, le système d’IA créé par la société londonienne DeepMind (détenue par Google depuis 2014), a permis de déterminer rapidement plusieurs structures protéiques du SARS-CoV-2, un virus sur lequel très peu d’informations étaient disponibles jusqu’à il y a quelques mois.
Le travail acharné des scientifiques et la collaboration internationale – avec l’aide de technologies de pointe en matière d’IA telles que celle de DeepMind – ont permis de réagir rapidement à la pandémie. En décembre 2020, pas moins de 61 vaccins potentiels étaient en cours de développement clinique, dont trois ont été approuvés par certaines autorités réglementaires nationales pour une utilisation à grande échelle, selon l’Organisation mondiale de la santéLien externe.
Dans le domaine biomédical, les chercheurs considèrent ce moment comme un tournant pour la science. «C’est une réalisation absolument incroyable», commente Torsten Schwede, vice-président de la recherche à l’Université de Bâle et chef du groupe de recherche de l’Institut suisse de Bioinformatique (SIB), qui a développé SWISS-MODEL, un serveur de modélisation de la structure des protéines entièrement automatisé utilisé par les chercheurs du monde entier. SWISS-MODEL est une référence dans le domaine de la biologie structurale informatique.
«Le partage ouvert des informations sur le CoV-2-SARS au sein de la communauté scientifique a permis de développer des vaccins en un temps record»
Torsten Schwede, chercheur
Personnes et logiciels
Petites mais d’une importance fondamentale en sciences médicales, les protéines sont à la base des processus chimiques et biologiques des cellules humaines et de tout organisme vivant. Les acides aminés qui composent les protéines se lient ensemble, formant des sortes d’«origamis» qui déterminent leur structure tridimensionnelle particulière. La connaissance de la forme des protéines facilite grandement la recherche biomédicale dans le domaine, par exemple, des maladies humaines. C’est pourquoi la communauté scientifique considère les résultats obtenus par DeepMind comme révolutionnaires. L’espoir est que cette réalisation se traduira par le développement de nouveaux médicaments et de traitements avancés.
SWISS-MODEL a été le premier logiciel au monde capable de modéliser de manière autonome la structure tridimensionnelle de protéines non encore découvertes par la méthode expérimentale. En 1993, Manuel Peitsch, bioinformaticien et fondateur de SWISS-MODEL, a lancé l’idée d’utiliser des systèmes de simulation informatique ne nécessitant pas d’intervention humaine pour obtenir des informations structurelles sur les protéines et mieux comprendre les fonctions moléculaires.
À l’époque, ce projet ressemblait à de la science-fiction. Aujourd’hui, grâce à des méthodes de plus en plus sophistiquées pour comparer des structures protéiques connues avec des séquences protéiques inconnues – ce qu’on appelle la «modélisation de l’homologie» – le logiciel a dépassé les capacités humaines en termes de précision et de performance et est utilisé dans le monde entier. Chaque année, SWISS-MODEL traite plus d’un million de demandes de modèles de protéines sans surveillance humaine.
Les protéines sont des objets flexibles. Des mouvements sont souvent nécessaires pour qu’ils puissent fonctionner. Pour comparer un modèle 3D d’une protéine avec une structure de référence expérimentale, le modèle doit être «tourné» jusqu’à ce qu’il y ait une superposition optimale. Mais pour les objets flexibles, ce chevauchement est difficile à obtenir. Pour résoudre ce problème, l’équipe de SWISS-MODEL a mis au point un score appelé lDDT (Local Distance Difference Test), qui évalue le degré de concordance d’une projection par rapport à la structure de référence, indépendamment des mouvements intramoléculaires. Ces scores, qui peuvent être utilisés sans supervision humaine, sont essentiels pour le développement de méthodes autonomes de modélisation des protéines.
Réalité et science-fiction
Au cours des trente dernières années, les scientifiques ont tenté de déduire la forme tridimensionnelle caractéristique des protéines à partir de leurs séquences d’acides aminés. Dans ce processus, la connaissance des structures expérimentales des protéines apparentées rend la modélisation relativement facile et précise. Dans les cas difficiles, cependant, l’absence d’informations structurelles sur une famille de protéines donnée signifie qu’il faut faire une prédiction très compliquée en partant de zéro, avec un résultat souvent inexact. Mais grâce à AlphaFold2, ce problème n’existe plus. «Nous avons vu que la méthode AlphaFold2 développée par DeepMind fonctionne aussi bien pour les cas simples que pour les cas très complexes. C’est une véritable percée, car maintenant l’IA peut accomplir quelque chose qu’aucun humain ayant une connaissance approfondie de la modélisation des protéines n’était capable de faire auparavant», détaille Torsten Schwede.
Le système d’IA de DeepMind, AlphaFold2, utilise des techniques avancées d’apprentissage machine, connues sous le nom de réseaux neuronaux profonds, pour prédire la structure des protéines directement à partir de leurs séquences génétiques. Pour ce faire, le système d’IA a appris les séquences et les structures d’environ 100’000 protéines connues en utilisant les données expérimentales mises à disposition par la communauté scientifique. Aujourd’hui, il est capable de faire des prédictions très précises sur les modèles 3D de n’importe quelle protéine. Les résultats extraordinaires obtenus par DeepMind ont été confirmés par les organisateurs de l’expérience CASP sur la structure des protéinesLien externe (voir encadré), qui ont qualifié les capacités de calcul et de prédiction d’AlphaFold2 de «sans précédent».
Le CASP (Critical Assessment of protein Structure Prediction) est une expérience qui a lieu tous les deux ans et qui évalue les développements dans le domaine de la prédiction de la structure des protéines au niveau international. Lors de la récente expérience qui s’est tenue en 2020 (CASP14), la précision des méthodes de prédiction a été évaluée sur près d’une centaine de cibles protéiques. Les prédictions d’AlphaFold2 se sont avérées très précises, même dans des cas difficiles, comme celui d’une protéine précédemment inconnue du SRAS-CoV-2, l’ORF8. Le SARS-CoV-2 est composé d’environ 30 protéines différentes, dont une douzaine sont peu connues.
La règle d’or du progrès
Le fort soutien de la communauté scientifique et l’échange ouvert d’informations dans le domaine de la biologie structurale informatique, auquel SWISS-MODEL a également contribué, sont quelques-uns des ingrédients qui expliquent le succès de DeepMind. Selon Torsten Schwede, le partage ouvert des méthodes de calcul et des données structurelles a donné à DeepMind les informations nécessaires pour résoudre l’un des problèmes les plus difficiles de la bioinformatique.
Les échanges se sont intensifiés pendant la pandémie, ce qui démontre l’importance de la collaboration pour obtenir des résultats significatifs dans un délai nettement plus court. «Nous avons beaucoup appris pendant cette pandémie. Le partage ouvert des informations sur le CoV-2-SARS au sein de la communauté scientifique a permis de développer des vaccins en un temps record», ajoute Torsten Schwede, en soulignant que le cloisonnement des données peut être extrêmement contre-productif pour la science.
En conformité avec les normes du JTI
Plus: SWI swissinfo.ch certifiée par la Journalism Trust Initiative
Vous pouvez trouver un aperçu des conversations en cours avec nos journalistes ici. Rejoignez-nous !
Si vous souhaitez entamer une conversation sur un sujet abordé dans cet article ou si vous voulez signaler des erreurs factuelles, envoyez-nous un courriel à french@swissinfo.ch.