Back to chapter

3.11:

Famille de protéines

JoVE Core
Molecular Biology
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Molecular Biology
Protein Families

Languages

Share

Une famille de protéines est un groupe de protéines qui a évolué d’un ancêtre génétique commun. Ces protéines ont des similitudes dans leurs structures tridimensionnelles et dans les fonctions qu’elles exécutent. Les protéines d’une même famille sont appelées homologues.Les protéines homologues qui ont évolué chez la même espèce sont appelées paralogues alors que les protéines homologues dans différentes espèces sont appelées orthologues. Une superfamille est composée de deux familles ou plus qui ont évolué d’un ancêtre commun plus éloigné que celle d’une famille de protéines. Les protéines d’une superfamille présentent des variations plus importantes en structure et en fonction.Les familles de protéines peuvent nous aider à formuler une hypothèse à propos de la fonction d’une protéine avec une séquence d’acides aminés connue mais une forme ou une fonction inconnue. Ces protéines peuvent être comparées à d’autres protéines dans la famille pour aider à prédire la structure tridimensionnelle et aider à déterminer la fonction de la protéine. Les familles de protéines se produisent souvent par duplication génétique quand les mécanismes génétiques dans un organisme créent une copie supplémentaire d’un gène.La copie originale du gène et son dupplicat peuvent muter et diverger en fonction car leur séquence génique code pour différentes séquences d’acides aminés comme leurs ancêtres génétiques. Les protéines d’une famille peuvent avoir une identité commune de séquence aussi faible que 30%C’est-à-dire, seulement 30 la séquence primaire d’acides aminés peut être identique. Cependant, la structure globale des protéines et les domaines au sein de la protéine sont souvent incroyablement similaires.Par exemple, l’hémoglobine et la myoglobine sont des protéines qui sont considérées comme ayant évolué par duplication génique. Les sous-unités alpha et bêta de l’hémoglobine n’ont qu’une identité de séquence d’acides aminés de 49%mais ont le même schéma général de structure protéique secondaires et tertiaires-c’est-à-dire, des positions de leurs hélices alpha et des tours de leur chaîne d’acides aminés similaires. Les sous-unité alpha de l’hémoglobine et de la myoglobine n’ont que 26 d’identité de séquence mais ont des structures secondaires et tertiaires similaires.Les trois protéines peuvent lier l’oxygène à travers un groupe hémique car ces protéines homologues sont membres d’une famille de protéines liant l’oxygène.

3.11:

Famille de protéines

Les familles de protéines sont des groupes de protéines homologues; c’est-à-dire qu’elles ont des similitudes dans les séquences d’acides aminés et les structures tridimensionnelles. Les familles de protéines se produisent généralement en raison de la duplication de gènes, où une copie supplémentaire d’un gène est insérée dans le génome de un organisme. Les mutations qui modifient les acides aminés tout en permettant à la protéine d’être correctement synthétisée conduiront à de nouveaux membres de la famille des protéines. Si ces nouvelles protéines contiennent des acides aminés similaires aux acides dans les emplacements clés, les domaines protéiques et éventuellement la structure tridimensionnelle globale, peuvent rester similaires.

Superfamilles de protéines

Les superfamilles de protéines sont de plus grands groupes de protéines qui ont évolué à partir d’un ancêtre plus éloigné. Ils ont généralement une homologie de séquence plus faible par rapport à une famille de protéines, mais ont toujours des caractéristiques structurelles importantes en commun. Chaque superfamille peut contenir plusieurs familles de protéines avec des structures et des fonctions plus étroitement liées.  Certaines familles plus nombreuses sont encore plus divisées en sous-familles.  La distinction exacte selon laquelle les protéines appartiennent à une superfamille, une famille ou une sous-famille peut varier selon les systèmes de classification et continue de changer à mesure que la quantité de séquences de protéines et de données structurelles continue de croître.

La superfamille des protéines d’immunoglobuline (IgSF) est l’une des plus grandes superfamilles de protéines ; plus de 700 membres de la superfamille se trouvent dans le génome humain.  Tous les membres de la superfamille contiennent un ou plusieurs domaines d’immunoglobuline (Ig). Ce domaine a une structure tridimensionnelle unique composée d’un sandwich de deux feuillets bêta antiparallèles, et la plupart sont impliqués dans l’adhésion cellulaire ou la liaison de ligands. L’IgSF contient de nombreuses familles comprenant des récepteurs d’antigène, des molécules d’adhésion cellulaire (CAM), des protéines du cytosquelette et plusieurs groupes de récepteurs de facteurs de croissance et de cytokines. Plusieurs des grandes familles sont encore divisées en sous-familles.   La famille des récepteurs d’antigènes peut encore être divisée en sous-familles : la famille des anticorps ou des immunoglobulines et la famille des récepteurs des cellules T ; les CAM peuvent être divisées en familles de protéines liées à NCAM, ICAM et CD2.

Bases de données de classification

Les classifications des familles de protéines permettent aux scientifiques de comprendre les relations fonctionnelles et évolutives entre les protéines. Plusieurs ressources en ligne peuvent être utilisées pour rechercher des familles de protéines connues ou classer les protéines nouvellement découvertes.  Pfam est l’une des nombreuses bases de données en ligne où un scientifique peut rechercher des protéines connues et les membres de leur famille.  Un chercheur peut également saisir la séquence d’acides aminés d’une protéine nouvellement découverte pour voir si elle pourrait appartenir à une famille connue de protéines en raison de la similarité de séquence.  Cela peut fournir une hypothèse vérifiable quant au rôle possible de la nouvelle protéine car  les membres d’une même famille ont souvent des structures et des fonctions similaires.

Suggested Reading

  1. 1PDB ID: 1GZX
    Paoli, M., Liddington, R., Tame, J., Wilkinson, A., Dodson, G. (1996)  Crystal Structure of T State Haemoglobin with Oxygen Bound at All Four Haems. J Mol Biol 256: 775
  2. 2PDB ID: 3RGK
    Hubbard, S.R., Lambright, S.G., Boxer, S.G., Hendrickson, W.A. (1990) X-ray crystal structure of a recombinant human myoglobin mutant at 2.8 A resolution. J Mol Biol 20: 215-218 DOI: 10.1016/S0022-2836(05)80181-0
  3. H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne. (2000) The Protein Data Bank Nucleic Acids Research, 28: 235-242.
  4. D. Sehnal, A.S. Rose, J. Kovca, S.K. Burley, S. Velankar (2018) Mol*: Towards a common library and tools for web molecular graphics MolVA/EuroVis Proceedings. doi:10.2312/molva.20181103
  5. S. El-Gebali, Sara ,et al. “The Pfam protein families database in 2019,” Nucleic Acids Research,47, no D1, (2019): D427–D432, https://doi.org/10.1093/nar/gky995
  6. S. El-Gebali, L. Richardson,  R. Finn  “Pfam: Quick Tour”  EMBL-EBI Train online. Accessed January 20, 2020, https://www.ebi.ac.uk/training/online/course/pfam-quick-tour
  7. “Protein families and structural evolution.” OpenLearn. Accessed January 20, 2020, https://www.open.edu/openlearn/science-maths-technology/science/biology/proteins/content-section-4.1
  8. A. Mitchell, A. Sangrador. “What Are Protein Families?” EMBL-EBI Train online. Accessed January 20, 2020, https://www.ebi.ac.uk/training/online/course/introduction-protein-classification-ebi/protein-classification/what-are-protein-families