13.5: Sequenze conservate tra specie

Multi-species Conserved Sequences
JoVE Core
Molecular Biology
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Molecular Biology
Multi-species Conserved Sequences

3,857 Views

02:51 min
April 07, 2021

Overview

Next-generation sequencing technologies have created large genomic databases of a variety of animals and plants. Ever since the human genome project was completed, scientists studied the genome of primates, mammals, and other phylogenetically distant living beings. Such large-scale  studies have provided new insights into the evolutionary relationship between organisms.

Although the genome of each species varies greatly from each other, a few sequences are highly conserved. Such conserved DNA sequences among two or more species are collectively known as “multi-species conserved sequences.” These sequences are less likely to mutate and remain mostly unchanged over a long time. For example, an exon and three intronic regions of the gene cystic fibrosis are highly conserved among humans and higher apes such as chimpanzees and orangutans.

Most multi-conserved sequences do not code for proteins; instead, they are transcribed into long non-coding RNAs or not transcribed at all. The RNA elements synthesized may be involved in epigenetic regulation of gene expression, pre-mRNA processing, alternate splicing, maturation, and stability. The non-transcribed sequences are called conserved non-genic sequences (CNG). Human-mouse genome comparison revealed approximately 327,000 CNGs in the human genome. Among them, 65% are intergenic regions, and 35% are in introns.

Ultraconserved sequences in the human genome

Ultraconserved sequences are DNA sequences that have undergone little to no change for  millions of years. Many of the ultraconserved sequences are concentrated in clusters near transcription factors and developmental genes loci.

Besides, there are some universally conserved genes. These genes are so fundamental to life that they are conserved right from bacteria to mammals. Examples include RNA polymerase, Helicases, GTP-binding elongation factors, and ABC transporters.

Transcript

Le sequenze nucleotidiche che sono conservate tra molte specie diverse sono chiamate sequenze conservate multi-specie.

Ad esempio, ci sono migliaia di segmenti di DNA tra esseri umani, ratti e topi che sono rimasti invariati dopo la divergenza di queste tre specie dal loro comune antenato mammifero.

Mentre una piccola percentuale di queste sequenze conservate codifica per RNA o proteine, la maggior parte sono sequenze di DNA non codificanti, chiamate anche sequenze non geniche conservate o CNG. Ad esempio, tra le sequenze conservate del genoma umano e del topo, solo un terzo di esse produce un trascritto funzionale, mentre i restanti due terzi sono CNG.

I CNG hanno una lunghezza compresa tra 50 e 200 nucleotidi e possono essere trovati nelle regioni intergeniche del genoma, negli introni all’interno di un gene o nelle regioni non tradotte del trascritto dell’RNA.

Alcune di queste sequenze sono estremamente conservate tra i lignaggi e sono quindi chiamate sequenze ultra-conservate. Esistono più di 5000 sequenze ultraconservate tra genomi umani, ratti e topi, ciascuna lunga circa 100 basi.

La conservazione delle sequenze nel corso di milioni di anni attraverso i lignaggi indica che le sequenze conservate multi-specie devono essere fondamentali per la sopravvivenza. Tuttavia, poiché la maggior parte delle sequenze conservate non codifica per una proteina, la loro funzione rimane ancora un mistero.

Si ipotizza che tali sequenze conservate abbiano le seguenti funzioni. In primo luogo, queste sequenze possono agire come potenziatori o silenziatori che si legano al meccanismo di trascrizione e controllano il livello di espressione genica.

In secondo luogo, le sequenze conservate possono essere trascritte in lunghi RNA non codificanti che regolano la maturazione e la stabilità del pre-mRNA.

In terzo luogo, queste sequenze potrebbero consentire l’interazione funzionale tra i cromosomi e aiutare a definire i territori cromosomici con modelli di espressione genica distinti all’interno del nucleo.
Le mutazioni rare nelle sequenze conservate in più specie rappresentano di solito un passo critico nell’evoluzione di nuove specie.

Ad esempio, i genomi dei primati comprendono sequenze specifiche altamente conservate vicino ai geni dello sviluppo neurale. Circa 6 milioni di anni fa, queste sequenze conservate subirono cambiamenti nucleotidici a ritmi eccezionali che portarono all’evoluzione del lignaggio umano.

Queste regioni, chiamate regioni umane accelerate o HAR, sono coinvolte nelle fasi critiche dello sviluppo del cervello e nel miglioramento delle funzioni cognitive.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for