Contexte

Ce projet s'inscrit dans le cadre du projet "jaws" soutenu financièrement par l'ANR (Resp. Jean-Yves Sire, UMR 7138-evolution Paris Seine, UPMC, Paris) dont le but principal est d'étudier l'origine évolutive, le mode d'évolution et les liens de parenté des protéines de la famille des SCPPs (pour secretory calcium-binding phosphoproteins). Ces protéines jouent un rôle crucial dans la minéralisation du squelette des vertébrés (os et dents) comme le montrent les maladies génétiques résultant de mutations de plusieurs d'entre elles. Certaines SCPPs étaient présentes chez les premiers vertébrés il y a 500 millions d'années puis la famille s'est agrandie par duplications successives. Toutefois, ces protéines ne sont pas structurées et ont des séquences très variables, ce qui rend difficile l'identification de leurs gènes, même dans des génomes séquencés.
C'est pourquoi nous avons décidé de pallier ce problème en séquençant le transcriptome de mâchoires (os et dents) de 24 espèces représentant différentes lignées de vertébrés. Le séquençage des trancriptomes puis l'assemblage des transcrits a généré de grands jeux de séquences (plusieurs dizaines de milliers de transcrits par transcriptome).
Les principaux objectifs sont:
- d'identifier, dans les transcriptomes assemblés, les gènes SCPPs en se fondant sur des séquences connues chez d'autres espcèes;
- d'annoter ces transcriptomes dans le but d'en faire bénéficier la communauté scientifique;
- d'identifier, dans les séquences non annotées, de nouveaux gènes susceptibles d'appartenir aux SCPPs en se fondant sur des motifs caractéristiques des protéines codées par ces gènes.

Context

This project is part of the "jaws" project financially supported by ANR (Jean-Yves Sire, UMR 7138-evolution Paris Seine, UPMC, Paris), whose main goal is to study the evolutionary origin of SCPP (for secretory calcium-binding phosphoprotein) proteins. These proteins play a crucial role in the mineralization of the vertebrate skeleton (bone and teeth) as shown by the genetic diseases resulting from mutations of several of them. Some SCPPs were present in early vertebrates 500 million years ago, and the family was enlarged through successive duplications. However, these proteins are not structured and have highly variable sequences, which makes it difficult to identify their genes even in sequenced genomes.
We decided to solve this problem by sequencing the transcriptome of jaws (containing bones and teeth) of 24 species representing different vertebrate lineages. Transcriptome sequencing, then transcript assembly generated large sets of sequences (several tens of thousands of transcripts per transcriptome).
The main objectives are:
- to identify, in the assembled transcriptomes, SCPP genes in using sequences known from other species;
- to annotate these transcriptomes in order to benefit the scientific community;
- to identify, in non-annotated sequences, new genes that may belong to the SCPP family in searching for characteristic motifs of the proteins encoded by these genes.

Species

JAWS Species

Tree generated with iTOL: Letunic and Bork (2016) Nucleic Acids Res doi: 10.1093/nar/gkw290

Contributors

UMR 7138-evolution Paris Seine, UPMC, Paris
Jean-Yves Sire (Project Leader)
Barbara Gasse
Jeremie Silvent
UMR 5554 CNRS-IRD-Université Montpellier 2 Institut des Sciences de l'Evolution
Frederic Delsuc
FR2424, ABiMS plateforme
Erwan Corre
Xi Liu

Data acces

Please send email to ABiMS HelpDesk to acces to download section