13.5:
Séquences conservées à travers plusieurs espèces
Next-generation sequencing technologies have created large genomic databases of a variety of animals and plants. Ever since the human genome project was completed, scientists studied the genome of primates, mammals, and other phylogenetically distant living beings. Such large-scale studies have provided new insights into the evolutionary relationship between organisms.
Although the genome of each species varies greatly from each other, a few sequences are highly conserved. Such conserved DNA sequences among two or more species are collectively known as “multi-species conserved sequences.” These sequences are less likely to mutate and remain mostly unchanged over a long time. For example, an exon and three intronic regions of the gene cystic fibrosis are highly conserved among humans and higher apes such as chimpanzees and orangutans.
Most multi-conserved sequences do not code for proteins; instead, they are transcribed into long non-coding RNAs or not transcribed at all. The RNA elements synthesized may be involved in epigenetic regulation of gene expression, pre-mRNA processing, alternate splicing, maturation, and stability. The non-transcribed sequences are called conserved non-genic sequences (CNG). Human-mouse genome comparison revealed approximately 327,000 CNGs in the human genome. Among them, 65% are intergenic regions, and 35% are in introns.
Ultraconserved sequences are DNA sequences that have undergone little to no change for millions of years. Many of the ultraconserved sequences are concentrated in clusters near transcription factors and developmental genes loci.
Besides, there are some universally conserved genes. These genes are so fundamental to life that they are conserved right from bacteria to mammals. Examples include RNA polymerase, Helicases, GTP-binding elongation factors, and ABC transporters.
Les séquences nucléotidiques qui sont conservées entre de nombreuses espèces différentes sont appelées séquences conservées multi-espèces.
Par exemple, il existe des milliers de segments d’ADN entre les humains, les rats et les souris qui sont restés inchangés depuis la divergence de ces trois espèces par rapport à leur ancêtre mammifère commun.
Alors qu’une petite proportion de ces séquences conservées codent pour de l’ARN ou des protéines, la majorité sont des séquences d’ADN non codantes, également appelées séquences non géniques conservées ou CNG. Par exemple, parmi les séquences conservées du génome humain et de la souris, seulement un tiers d’entre elles produisent un transcrit fonctionnel tandis que les deux tiers restants sont des CNG.
Les CNG ont une longueur d’environ 50 à 200 nucléotides et peuvent être trouvés dans des régions intergéniques du génome, des introns à l’intérieur d’un gène ou des régions non traduites du transcrit de l’ARN.
Certaines de ces séquences sont extrêmement conservées à travers les lignées et sont donc appelées séquences ultra-conservées. Il existe plus de 5000 séquences ultraconservées entre les génomes de l’homme, du rat et de la souris, chacune d’une longueur d’environ 100 bases.
La conservation des séquences sur des millions d’années à travers les lignées indique que les séquences conservées par plusieurs espèces doivent être essentielles à la survie. Cependant, comme la plupart des séquences conservées ne codent pas pour une protéine, leur fonction reste encore un mystère.
On suppose que de telles séquences conservées ont les quelques fonctions suivantes. Tout d’abord, ces séquences peuvent agir comme des amplificateurs ou des silencieux qui se lient à la machinerie de transcription et contrôlent le niveau d’expression des gènes.
Deuxièmement, les séquences conservées peuvent être transcrites en longs ARN non codants qui régulent la maturation et la stabilité des pré-ARNm.
Troisièmement, ces séquences pourraient permettre une interaction fonctionnelle entre les chromosomes et aider à définir les territoires chromosomiques avec des modèles d’expression génique distincts dans le noyau.
Les mutations rares dans les séquences conservées par plusieurs espèces représentent généralement une étape critique dans l’évolution de nouvelles espèces.
Par exemple, les génomes des primates englobent des séquences spécifiques hautement conservées près des gènes de développement neuronal. Il y a environ 6 millions d’années, ces séquences conservées ont subi des changements nucléotidiques à des taux exceptionnels, conduisant à l’évolution de la lignée humaine.
Ces régions, appelées régions accélérées humaines ou HAR, sont impliquées dans les étapes critiques du développement du cerveau et de l’amélioration des fonctions cognitives.
Related Videos
Genomes and Evolution
5.6K Vues
Genomes and Evolution
4.1K Vues
Genomes and Evolution
5.7K Vues
Genomes and Evolution
3.2K Vues
Genomes and Evolution
3.9K Vues
Genomes and Evolution
6.0K Vues
Genomes and Evolution
3.5K Vues
Genomes and Evolution
16.9K Vues