Introduction

Les progrès réalisés dans le clonage de gènes impliqués dans les maladies, tant monogéniques que polygéniques, couplés à l’apparition de nouvelles méthodes d’identification des mutations, ont abouti à l'émergence d’un nouveau champ de la génétique : l’analyse des mutations.

La nécessité d’une annotation précise des caractères génétiques, biochimiques et phénotypiques associés à chaque mutation ne pouvant être réalisés que par des experts (curators), a amenée notre équipe a se spécialiser dans la création de banques de données spécifiques d'un locus (Locus Specific Databases ou LSDB).

Afin de fournir à la communauté scientifique un outil générique permettant, d’une part, de créer ces LSDBs et, d’autre part, de disposer d’un large éventail de fonctions d’analyse de ces données, nous avons créé le logiciel UMD® (Universal Mutation Database).

Ce logiciel est aujourd’hui reconnu tant au plan national qu’international comme l’un des outils de référence par la société HGVS (Human Genome Variation Society) ainsi que l’organisation HUGO (Human Genome Organization), de plus Ce logiciel est distribué gratuitement à la communauté scientifique depuis 1998.

Nous avons ainsi de nombreux collaborateurs Français, Européens et internationaux.


L'outil UMD a récemment été choisi par le réseau d'excellence Européen pour créer les banques de données de mutations des gènes impliqués dans les maladies neuromusculaires et pouvant faire l'objet de nouvelles approches thérapeutiques comme la Myopathie de Duchenne (DMD) et l'Amyotrophie spinale (SMA) .

 

UMD est en constante évolution, nous y intégrons ainsi de nouvelles fonctionnalités permettant notamment d’aborder la question de l’hétérogénéité allélique (un gène – plusieurs maladies) via des études de corrélations génotype-phénotype, d’intégrer l’ensemble des séquences non codantes du locus (introns, séquences régulatrices) mais également d’aborder des problèmes plus complexes comme l’aide à l’interprétation des mutations introniques. De plus nous y avons intégré la gestion des images provenant par exemple d’hybridation sur coupes de tissus, de résultats de Western Blots... qui sont d’un grand apport pour les utilisateurs tant chercheurs que généticiens impliqués dans le diagnostic. Enfin, le développement du projet génome ainsi que celui du consortium international des SNPs ("Single Nucleotide Polymorphism") ont fourni une grande quantité d’informations sur la structure du génome que nous extrayons et associons à chaque locus des LSDBs (séquences génomiques exhaustives, SNPs…).

Développement de nouvelles fonctions spécialisées d’analyse

Comme nous l’avons évoqué précédemment, nos objectifs sont de mettre la puissance de l’analyse informatique au service du diagnostic, de la clinique et de la recherche. Le développement de nouvelles fonctions d’analyse est ainsi étroitement lié aux avancées scientifiques dans le domaine de la thérapie mais aussi dans celui de la compréhension des mécanismes mutationnels. UMD est actuellement le seul logiciel permettant de créer des LSDBs et à proposer de nombreux outils d’analyse spécialisés. Ces outils sont nés d’une étroite collaboration avec nos différents partenaires.

Quelques exemples d’outils (Béroud et al. 2005, Béroud et al. 2000) :

* Gestion des mutations introniques avec présentation graphique du retentissement au niveau des sites donneurs et accepteurs d’épissage, recherche d’exons cryptiques,

* Présentation graphique des données SNPs avec possibilité de zoom,

* Calcul des différentes possibilités d’épissage d’exons "exon-skipping" permettant de restaurer une phase ouverte de lecture compatible avec une protéine fonctionnelle (Béroud et al. 2007),

* Fonctions d’analyse des mutations localisées dans des domaines répétés d’une protéine (alignement des domaines),

* Corrélation génotype-phénotype et phénotype-génotype,

La plus grande partie de ces fonctions d’analyse est disponible directement via Internet. L’interface de nos pages web peut également être adaptée à chaque gène à la demande des curateurs. Pour l'utilisateur, nous avons mis en place un mode d'utilisation alliant richesse (requêtes paramétrables sur l'ensemble des données) et souplesse (l'utilisateur peut définir ses propres profils d’affichage des tableaux de mutations).

Développement du logiciel UMD-central

Parallèlement, nous avons entrepris le développement d’un nouvel outil (UMD central) permettant d’effectuer des requêtes croisées entre ces LSDBs afin d’élargir leur domaine d’utilisation à celui de l’hétérogénéité génétique (une maladie – plusieurs gènes).

Aujourd’hui les seuls outils disponibles correspondent aux banques de données générales et aux banques de données spécifiques d’un gène. Dans le premier cas, l’hétérogénéité génétique ne peut être abordée par manque d’informations sur le phénotype clinique, dans le second par une trop grande spécificité (seules les informations sur un locus sont disponibles). Il était ainsi important de proposer un outil permettant de combler ce manque. Notre approche consiste à utiliser la richesse des informations phénotypiques disponibles dans les LSDBs et à les utiliser grâce à un outil capable de réaliser une interrogation croisée de l’ensemble des UMD-LSDBs. Pour cela, nous avons choisi de développer l’outil UMD-central à partir du langage 4D. Cet outil pourra communiquer avec l’ensemble des UMD-LSDB grâce à des process de communication installés dans chaque application. Un prototype a déjà démontré la faisabilité de cette approche. Afin d’optimiser les performances, nous avons choisi de maintenir un lexique de l’ensemble des termes cliniques employés dans les différentes LSDBs grâce à une procédure automatique de mise à jour des informations. Ainsi, lorsqu’un utilisateur se connecte à UMD-central via Internet, l’ensemble des termes de ce lexique lui est proposé afin de faciliter la saisie. Après avoir choisi sur quelles banques de données il souhaite réaliser sa recherche, UMD-central limitera ses requêtes aux UMD-LSDBs intégrant les termes sélectionnés.

Maintenance et développement des LSDBs

Les différentes UMD-LSDBs disponibles via Internet sur notre site sont pour la plupart reconnues comme des banques de référence au niveau international (APC, EMD, FBN1, LDLR, LMNA, MEN1, SUR1, TP53, VHL, ...). Les données validées par nos partenaires (curateurs de chaque LSDBs) nous sont envoyées pour être mis en ligne sur le serveur http://www.umd.be. La durée nécessaire à la création d’une LSDB peut varier d’une semaine à plusieurs mois en fonction du nombre de mutations à saisir et de la qualité des données phénotypiques disponibles. Par la suite une saisie régulière des mutations publiées est nécessaire.

Le développement de l’outil UMD est réalisé grâce au logiciel de programmation 4D, version 2003, ce qui permet de produire un code source compatible Mac et PC et ainsi d’assurer sa distribution à de nombreux laboratoires.

Composition de l’équipe

Christophe BEROUD

Dalil HAMROUN

Véronique HUMBERTCLAUDE

François-Olivier DESMET

Marine LALANDE

Publications

Frédéric MY, Monino C, Marschall C, Hamroun D, Faivre L, Jondeau G, Klein HG, Neumann L, Gautier E, Binquet C, Maslen C, Godfrey M, Gupta P, Milewicz D, Boileau C, Claustres M, Béroud C, Collod-Béroud G. The FBN2 gene :  new mutations, locus-specific database (Universal Mutation Database FBN2), and genotype-phenotype correlations. Hum Mutat. 2008 Sep 2. PMID :  18767143

Beroud C, Tuffery-Giraud S, Matsuo M, Hamroun D, Humbertclaude V, Monnier N, Moizard MP, Voelckel MA, Calemard LM, Boisseau P, Blayau M, Philippe C, Cossee M, Pages M, Rivier F, Danos O, Garcia L, Claustres M. Multiexon skipping leading to an artificial DMD protein lacking amino acids from exons 45 through 55 could rescue up to 63% of patients with Duchenne muscular dystrophy. Hum Mutat. 2007 Feb;28(2):196-202.

Deburgrave N, Daoud F, Llense S, Barbot JC, Recan D, Peccate C, Burghes AH, Beroud C, Garcia L, Kaplan JC, Chelly J, Leturcq F. Protein- and mRNA-based phenotype-genotype correlations in DMD/BMD with point mutations and molecular basis for BMD with nonsense and frameshift mutations in the DMD gene. Hum Mutat. 2007 Feb;28(2):183-95.

Soussi T, Ishioka C, Claustres M, Beroud C. Locus-specific mutation databases: pitfalls and good practice based on the p53 experience. Nat Rev Cancer. 2006 Jan;6(1):83-90. Review.

Soussi T, Asselain B, Hamroun D, Kato S, Ishioka C, Claustres M, Beroud C. Meta-analysis of the p53 mutation database for mutant p53 biological activity reveals a methodologic bias in mutation detection. Clin Cancer Res. 2006 Jan 1;12(1):62-9.

Hamroun D, Kato S, Ishioka C, Claustres M, Beroud C, Soussi T. The UMD TP53 database and website: update and revisions. Hum Mutat. 2006 Jan;27(1):14-20.

Beroud C, Hamroun D, Collod-Beroud G, Boileau C, Soussi T, Claustres M. UMD (Universal Mutation Database): 2005 update. Hum Mutat. 2005 Sep;26(3):184-91.

Nguyen K, Bassez G, Bernard R, Krahn M, Labelle V, Figarella-Branger D, Pouget J, Hammouda el H, Beroud C, Urtizberea A, Eymard B, Leturcq F, Levy N. Dysferlin mutations in LGMD2B, Miyoshi myopathy, and atypical dysferlinopathies. Hum Mutat. 2005 Aug;26(2):165.

Hamroun D, Beroud C, Fontaine B, Kaplan JC. Introducing the online version of the gene table for neuromuscular disease (nuclear genes only). Neuromuscul Disord. 2005 Jan;15(1):88. No abstract available.

Collod-Beroud G, Le Bourdelles S, Ades L, Ala-Kokko L, Booms P, Boxer M, Child A, Comeglio P, De Paepe A, Hyland JC, Holman K, Kaitila I, Loeys B, Matyas G, Nuytinck L, Peltonen L, Rantamaki T, Robinson P, Steinmann B, Junien C, Beroud C, Boileau C. Update of the UMD-FBN1 mutation database and creation of an FBN1 polymorphism database. Hum Mutat. 2003 Sep;22(3):199-208. Review.

Bonne G, Yaou RB, Beroud C, Boriani G, Brown S, de Visser M, Duboc D, Ellis J, Hausmanowa-Petrusewicz I, Lattanzi G, Merlini L, Morris G, Muntoni F, Opolski G, Pinto YM, Sangiuolo F, Toniolo D, Trembath R, van Berlo JH, van der Kooi AJ, Wehnert M. 108th ENMC International Workshop, 3rd Workshop of the MYO-CLUSTER project: EUROMEN, 7th International Emery-Dreifuss Muscular Dystrophy (EDMD) Workshop, 13-15 September 2002, Naarden, The Netherlands. Neuromuscul Disord. 2003 Aug;13(6):508-15. Review.

Soussi T, Beroud C. Significance of TP53 mutations in human cancer: a critical analysis of mutations at CpG dinucleotides. Hum Mutat. 2003 Mar;21(3):192-200. Review.

Beroud C, Soussi T. The UMD-p53 database: new mutations and analysis tools. Hum Mutat. 2003 Mar;21(3):176-81. Review.

Villeger L, Abifadel M, Allard D, Rabes JP, Thiart R, Kotze MJ, Beroud C, Junien C, Boileau C, Varret M. The UMD-LDLR database: additions to the software and 490 new entries to the database. Hum Mutat. 2002 Aug;20(2):81-7. Review.

Soussi T, Beroud C. Assessing TP53 status in human tumours to evaluate clinical outcome. Nat Rev Cancer. 2001 Dec;1(3):233-40. Review.

Soussi T, Dehouche K, Beroud C. p53 website and analysis of p53 gene mutations in human cancer: forging a link between epidemiology and carcinogenesis. Hum Mutat. 2000;15(1):105-13.

Beroud C, Collod-Beroud G, Boileau C, Soussi T, Junien C. UMD (Universal mutation database): a generic software to build and analyze locus-specific databases. Hum Mutat. 2000;15(1):86-94.

Jeanpierre C, Beroud C, Niaudet P, Junien C. Software and database for the analysis of mutations in the human WT1 gene. Nucleic Acids Res. 1998 Jan 1;26(1):271-4.

Laurent-Puig P, Beroud C, Soussi T. APC gene: database of germline and somatic mutations in human tumors and cell lines. Nucleic Acids Res. 1998 Jan 1;26(1):269-70.

Beroud C, Joly D, Gallou C, Staroz F, Orfanelli MT, Junien C. Software and database for the analysis of mutations in the VHL gene. Nucleic Acids Res. 1998 Jan 1;26(1):256-8.

Varret M, Rabes JP, Thiart R, Kotze MJ, Baron H, Cenarro A, Descamps O, Ebhardt M, Hondelijn JC, Kostner GM, Miyake Y, Pocovi M, Schmidt H, Schuster H, Stuhrmann M, Yamamura T, Junien C, Beroud C, Boileau C. LDLR Database (second edition): new additions to the database and the software, and results of the first molecular analysis. Nucleic Acids Res. 1998 Jan 1;26(1):248-52.

Collod-Beroud G, Beroud C, Ades L, Black C, Boxer M, Brock DJ, Holman KJ, de Paepe A, Francke U, Grau U, Hayward C, Klein HG, Liu W, Nuytinck L, Peltonen L, Alvarez Perez AB, Rantamaki T, Junien C, Boileau C. Marfan Database (third edition): new mutations and new routines for the software. Nucleic Acids Res. 1998 Jan 1;26(1):229-3.

Beroud C, Soussi T. p53 gene mutation: software and database. Nucleic Acids Res. 1998 Jan 1;26(1):200-4.

Varret M, Rabes JP, Collod-Beroud G, Junien C, Boileau C, Beroud C. Software and database for the analysis of mutations in the human LDL receptor gene. Nucleic Acids Res. 1997 Jan 1;25(1):172-80.

Collod-Beroud G, Beroud C, Ades L, Black C, Boxer M, Brock DJ, Godfrey M, Hayward C, Karttunen L, Milewicz D, Peltonen L, Richards RI, Wang M, Junien C, Boileau C. Marfan Database (second edition): software and database for the analysis of mutations in the human FBN1 gene. Nucleic Acids Res. 1997 Jan 1;25(1):147-50.

Beroud C, Soussi T. p53 and APC gene mutations: software and databases. Nucleic Acids Res. 1997 Jan 1;25(1):138.

Beroud C, Fournet JC, Jeanpierre C, Droz D, Bouvier R, Froger D, Chretien Y, Marechal JM, Weissenbach J, Junien C. Correlations of allelic imbalance of chromosome 14 with adverse prognostic parameters in 148 renal cell carcinomas. Genes Chromosomes Cancer. 1996 Dec;17(4):215-24.

Beroud C, Verdier F, Soussi T. p53 gene mutation: software and database. Nucleic Acids Res. 1996 Jan 1;24(1):147-50.