Accélérer la recherche en génomique et protéomique grâce aux technologies de grid computing
Parce que l’innovation technologique, notamment informatique, peut répondre à de nouveaux besoins de la recherche en génétique, trois acteurs majeurs dans leur domaine, l’AFM, association de malades, le CNRS, organisme de recherche, et IBM, société d’informatique, lancent le Programme Décrypthon, une plate-forme de Grid Computing. Objectif : accélérer la recherche en génomique et en protéomique pour progresser plus rapidement dans la compréhension des maladies génétiques, notamment des maladies neuromusculaires.
Lancée lors du Téléthon 2001, une première opération Décrypthon avait permis la réalisation, en quelques semaines, d’une première base de données de toutes les protéines du monde vivant grâce à 75 000 ordinateurs individuels mis en réseau. Aujourd’hui, le Programme Décrypthon permet à la recherche d’aller encore plus loin et encore plus vite dans la compréhension du vivant.
La plate-forme de Grid Computing
Le Programme Décrypthon est une plate-forme technologique de pointe reposant à nouveau sur le Grid Computing. Cette plate-forme sera composée de deux grilles spécifiques pour générer la puissance de calcul nécessaire au traitement de projets de recherche très complexes. Le recours à l’une ou l’autre des grilles, voire à la combinaison des deux, s’effectuera en fonction des spécificités des programmes de recherche sélectionnés.
§ La grille dite « universitaire » est constituée des supercalculateurs des centres universitaires de Bordeaux 1, Lille 1 (USTL) et Paris Pierre et Marie Curie (Paris 6 Jussieu), auxquels seront ajoutés des serveurs à base de technologies Power 4+ et Power 5 de dernière génération offerts par IBM. Un serveur central, fédérant l’ensemble de ces ressources, sera également offert par IBM à l’université d’Orsay (Paris Sud) qui en assurera l’exploitation. L’ensemble de ces ressources sera connecté par le réseau à haut débit RENATER (Réseau National de Télécommunications pour la Technologie, l’Enseignement et la Recherche) qui relie les établissements français d’enseignement supérieur et de recherche. La puissance de calcul initiale de cette grille universitaire sera de 298 Gflops auxquels pourront s’ajouter, si nécessaire, une partie des 473 Gflops déjà présents dans les trois universités.
§ Une grille dite « d’internautes » qui pourra être activée dans un deuxième temps en fonction des projets scientifiques à venir. Elle accueillera alors les ordinateurs individuels. (fonctionnant sous Windows dans un premier temps et plus tard sous MacOS ou Linux) d’internautes souhaitant participer au Programme Décrypthon en mettant à disposition des scientifiques des « cycles de calcul » non utilisés par leur machine. La puissance de cette grille d’internautes variera en fonction du nombre d’internautes mobilisés, sachant que chaque ordinateur a une puissance théorique moyenne d’environ 1 Gflops.
Le Programme Décrypthon utilisera la suite logicielle Grid MP de la société américaine United Devices, dans le cadre de la planification, l’exécution et le suivi des programmes informatiques de chaque projet.
L’enjeu scientifique : la révolution protéomique
Le déchiffrage complet du génome humain, en 2003-2004, a montré que les liens biologiques qui lient les éventuelles modifications du génome et les maladies qui en découlent, sont plus complexes. L’approfondissement des connaissances dans le domaine de la protéomique constitue donc un axe prioritaire de la recherche en génétique à l’aube de ce troisième millénaire.
Pendant 3 ans, la plate-forme du Programme Décrypthon accueillera une dizaine de projets de recherche ayant pour but, notamment, de mieux comprendre le fonctionnement et le rôle des protéines, de prédire leur fonction, de progresser dans la connaissance de leur structure en trois dimensions, ou de croiser les données du génome avec celles du protéome.
Le Programme Décrypthon est déjà une réalité : deux projets pilotes ont été sélectionnés auprès de la communauté scientifique française et étrangère.
· « les mutations structurales avec leurs conséquences sur le phénotype des pathologies humaines ». Un projet coordonné par Olivier Poch (Illkirch, IGBMC / CNRS / Inserm) et Gilbert Deléage (Lyon, IBCP/ CNRS).
L’objectif est double : mettre au point une grille d’analyse descriptive des protéines avec des mutations connues, et élaborer un outil prédictif pour faciliter la compréhension de ces mutations dans les maladies humaines. Ce projet s’inscrit dans le contexte fondamental de la compréhension des mécanismes qui contrôlent la fonction des protéines. La façon dont une protéine se replie dans l’espace détermine ses interactions avec l’environnement cellulaire, y compris la manière dont elle va interagir avec les molécules thérapeutiques. Son démarrage est prévu en mai 2005.
· « Développement et utilisation d’approches informatiques pour l’analyse des liens existant entre les défauts d’épissage et les maladies génétiques ». Un projet piloté par Christiane Branlant, Fabrice Leclerc (Nancy, Laboratoire de Maturation des ARN et Enzymologie Moléculaire / CNRS), et Yann Guermeur (Nancy, LORIA / CNRS / INP Lorraine / INRIA).
Il s’agit de l’analyse des liens existant entre les défauts d’épissage (processus de fabrication de la protéine à partir de l’ADN) et les maladies génétiques. En apportant des données fondamentales pour la compréhension des maladies génétiques, cette étude devrait permettre le développement de thérapies basées sur la réparation de l’épissage impliquant, par exemple, le saut d’exon. Son démarrage est prévu à l’automne 2005.
Un appel d’offres scientifique a été lancé fin 2004 afin de sélectionner de nouveaux projets.
Les entreprises sollicitées pour « prendre part »
Le Programme Décrypthon s’appuie sur un financement innovant, reposant sur un principe clair : à calcul informatique partagé, financement partagé. L’AFM organise donc une opération de collecte spécifique baptisée « Décrypthon Entreprise ». Toutes les entreprises sont ainsi invitées à souscrire au Programme Décrypthon en achetant une ou plusieurs parts de ce projet :
1 part du Programme Décrypthon = 1000 Euros.
Le coût prévisionnel du Programme Décrypthon est estimé à 1,8 million d’euros par an sur 3 ans, dont 40 % sont assurés par des contributions en nature d’IBM, du CNRS et de l’AFM, et 60 % seront assurés grâce aux souscriptions des entreprises.
L’adhésion des entreprises à l’objectif et aux ambitions du Programme Décrypthon leur permet de devenir actrices d’un programme scientifique innovant et, plus globalement, de s’inscrire dans une démarche de soutien à la recherche et à l’innovation en santé. En achetant des parts, elles deviennent des Entreprises Partenaires du Programme Décrypthon.
Pour souscrire, s’informer et suivre le Programme Décrypthon, rendez-vous sur www.decrypthon.fr
Contacts Presse :
AFM : Estelle Assaf, Delphine Carvalho -01 69 47 28 28
CNRS : Martine Hasler – 01 44 96 46 35
IBM : Véronique Barone – 01 49 05 73 35