Back to chapter

3.11:

Famílias de Proteínas

JoVE Core
Molecular Biology
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Molecular Biology
Protein Families

Languages

Share

Uma família de proteínas é um grupo de proteínas que evoluíram de um ancestral genético comum. Estas proteínas têm semelhanças nas suas estruturas tridimensionais e as funções que executam. As proteínas dentro de uma família são chamadas de homólogas.Proteínas homólogas que evoluíram na mesma espécie são chamadas de parálogos, enquanto proteínas homólogas em diferentes espécies são chamadas ortólogos. Uma superfamília é composta por duas ou mais famílias que evoluíram de um ancestral comum mais distante do que o de uma família de proteínas. As proteínas em uma superfamília têm maiores variações na estrutura e função.As famílias de proteínas podem ajudar-nos a fazer uma hipótese sobre a função de uma proteína com uma sequência conhecida de aminoácidos, mas forma ou função desconhecida. Essas proteínas podem ser comparadas a outras proteínas da família para ajudar a prever a estrutura tridimensional e ajudar a determinar a função da proteína. As famílias de proteínas ocorrem frequentemente através da duplicação de genes, quando os mecanismos genéticos de um organismo criam uma cópia extra de um gene.A cópia original do gene e sua cópia duplicada podem sofrer mutação e divergir na função como suas sequências gênicas codificam diferentes sequências de aminoácido do que seus ancestrais genéticos. As proteínas dentro de uma família podem ter uma identidade de sequência tão baixa quanto 30%Ou seja, apenas 30 sequência primária de aminoácidos pode ser idêntica. Entretanto, a estrutura total da proteína e os domínios dentro da proteína são muitas vezes incrivelmente semelhantes.Por exemplo, a hemoglobina e a mioglobina são proteínas que se pensa terem evoluído com a duplicação genética. As subunidades alfa e beta de hemoglobina têm apenas 49%identidade de sequência de aminoácidos, mas têm o mesmo padrão geral de estrutura de proteína secundária e terciária isto é, posições semelhantes de suas hélices alfas e voltas de sua cadeia de aminoácidos. A subunidade alfa da hemoglobina e a mioglobina têm apenas 26 identidade sequencial, mas também têm estruturas secundárias e terciárias semelhantes.Todas as três proteínas podem se ligar ao oxigénio através de um grupo heme, uma vez que estas proteínas homólogas são membros de uma família de proteínas de ligação ao oxigénio.

3.11:

Famílias de Proteínas

As famílias de proteínas são grupos de proteínas homólogas, ou seja, têm semelhanças em sequências de aminoácidos e estruturas tridimensionais. As famílias de proteínas ocorrem geralmente devido à duplicação de genes, em que uma cópia adicional de um gene é inserida no genoma de um organismo.   Mutações que alteram os aminoácidos, mas ainda permitem que a proteína seja adequadamente sintetizada, levarão a novos membros da família de proteínas.   Se estas novas proteínas contiverem aminoácidos semelhantes em localizações chave, domínios de proteínas e, possivelmente, a estrutura tridimensional global, podem permanecer semelhantes.   As proteínas dentro de uma família podem ter até 30% de homologia de sequência de aminoácidos, e ainda executarem funções relacionadas.

Superfamílias de Proteínas

As superfamílias de proteínas são grupos maiores de proteínas que evoluíram de um ancestral mais distante. Geralmente têm homologia de sequência mais baixa em comparação com uma família de proteínas, mas ainda têm características estruturais significativas em comum. Cada superfamília pode conter várias famílias de proteínas com estruturas e funções mais intimamente relacionadas.  Algumas famílias maiores são divididas ainda mais em subfamílias.  A distinção exacta quanto a se as proteínas pertencem a uma superfamília, família ou subfamília pode variar entre sistemas de classificação e ainda está a mudar à medida que a quantidade de sequência de proteínas e dados estruturais continuam a crescer.

A superfamília de proteínas de imunoglobulina (IgSF) é uma das maiores superfamílias de proteínas; mais de 700 membros da superfamília são encontrados no genoma humano.  Todos os membros da superfamília contêm um ou mais domínios de imunoglobulina (Ig). Este domínio tem uma estrutura tridimensional única composta por um sanduíche de duas folhas beta paralelas, e a maioria está envolvida na adesão celular ou ligação a ligandos. A IgSF contém muitas famílias, incluindo receptores de antigénios, moléculas de adesão celular (CAMs), proteínas do citoesqueleto, e vários grupos de factores de crescimento e receptores de citocinas. Várias das famílias maiores estão ainda divididas em subfamílias.   A família de receptores de antigénios pode ser ainda dividida em subfamílias: a família de anticorpos ou imunoglobulinas e a família dos receptores de células T; as CAMs podem ser divididas nas famílias de proteínas relacionadas com NCAM, ICAM, e CD2.

Bases de Dados de Classificação

As classificações das famílias de proteínas permitem aos cientistas compreender as relações funcionais e evolutivas entre as proteínas. Vários recursos online podem ser usados para procurar famílias de proteínas conhecidas ou classificar proteínas recém-descobertas.  A Pfam é uma das várias bases de dados online onde um cientista pode procurar proteínas conhecidas e os membros da sua família.  Um investigador também pode inserir a sequência de aminoácidos de uma proteína recém-descoberta para ver se ela pode pertencer a uma família conhecida de proteínas devido à semelhança da sequência.  Isto pode fornecer uma hipótese testável a respeito da possível função da nova proteína uma vez que  os membros de uma família têm frequentemente estruturas e funções semelhantes.

Suggested Reading

  1. 1PDB ID: 1GZX
    Paoli, M., Liddington, R., Tame, J., Wilkinson, A., Dodson, G. (1996)  Crystal Structure of T State Haemoglobin with Oxygen Bound at All Four Haems. J Mol Biol 256: 775
  2. 2PDB ID: 3RGK
    Hubbard, S.R., Lambright, S.G., Boxer, S.G., Hendrickson, W.A. (1990) X-ray crystal structure of a recombinant human myoglobin mutant at 2.8 A resolution. J Mol Biol 20: 215-218 DOI: 10.1016/S0022-2836(05)80181-0
  3. H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne. (2000) The Protein Data Bank Nucleic Acids Research, 28: 235-242.
  4. D. Sehnal, A.S. Rose, J. Kovca, S.K. Burley, S. Velankar (2018) Mol*: Towards a common library and tools for web molecular graphics MolVA/EuroVis Proceedings. doi:10.2312/molva.20181103
  5. S. El-Gebali, Sara ,et al. “The Pfam protein families database in 2019,” Nucleic Acids Research,47, no D1, (2019): D427–D432, https://doi.org/10.1093/nar/gky995
  6. S. El-Gebali, L. Richardson,  R. Finn  “Pfam: Quick Tour”  EMBL-EBI Train online. Accessed January 20, 2020, https://www.ebi.ac.uk/training/online/course/pfam-quick-tour
  7. “Protein families and structural evolution.” OpenLearn. Accessed January 20, 2020, https://www.open.edu/openlearn/science-maths-technology/science/biology/proteins/content-section-4.1
  8. A. Mitchell, A. Sangrador. “What Are Protein Families?” EMBL-EBI Train online. Accessed January 20, 2020, https://www.ebi.ac.uk/training/online/course/introduction-protein-classification-ebi/protein-classification/what-are-protein-families