Les génomes des eucaryotes peuvent être structurés en plusieurs catégories fonctionnelles. Un brin d’ADN est composé de gènes et de régions intergéniques. Les gènes eux-mêmes sont constitués d’exons codant des protéines et d’introns non codants. Les introns sont excisés une fois que la séquence est transcrite en ARNm, ne laissant que des exons pour coder des protéines.
Dans les génomes eucaryotes, les gènes sont séparés par de grandes étendues d’ADN qui ne codent pas de protéines. Cependant, ces régions intergéniques portent des éléments importants qui régulent l’activité des gènes, par exemple, le promoteur où la transcription commence, ainsi que les amplificateurs et les inactivateurs qui règlent avec précision l’expression des gènes. Parfois, ces sites de liaison peuvent être situés loin du gène associé.
En étudiant le mécanisme de la transcription des gènes chez les eucaryotes, les chercheurs ont réalisé que l’ARNm final qui code une protéine est plus court que l’ADN dont il est dérivé. Cette différence de longueur est due à un processus nommé épissage. Une fois que le pré-ARNm a été transcrit à partir de l’ADN dans le noyau, l’épissage enlève immédiatement les introns et réuni les exons. Le résultat est de l’ARNm codant des protéines qui se déplace vers le cytoplasme et qui est traduit en protéines.
L’un des plus grands gènes humains, DMD, est long de plus de deux millions de paires de bases. Ce gène code la protéine du muscle dystrophine. Les mutations dans le DMD causent la dystrophie musculaire, un trouble caractérisé par la détérioration progressive du muscle. Ce gène contient 79 exons et 103 introns. À l’autre extrémité du spectre se trouve le gène de l’histone H1A — c’est l’un des plus petits gènes dans le génome humain à seulement 781 paires de bases de long avec un exon mais aucun intron.
Est-ce que les introns sont des déchets de l’ADN qui doivent être enlevés ? Fait intéressant, les introns peuvent transporter des éléments qui sont importants pour la régulation des gènes. De plus, la coupure de la transcription initiale et le réassemblage des exons permettent de mélanger les séquences d’ADN. Ce processus de mélange et d’appariement des exons est connu sous le nom d’épissage alternatif. Il permet de produire plusieurs variantes protéiques à partir d’une seule séquence codante.
Saviez-vous que 99 % de votre génome ne code pas des protéines ? Au début de la recherche sur le génome, les biologistes ont inventé le terme accrocheur “ ADN poubelle ” pour ces séquences apparemment non fonctionnelles. Pendant ce temps, nous avons appris qu’une grande partie de l’ADN non codant comporte des fonctions importantes. Au moins 9 % du génome humain est impliqué dans la régulation des gènes, soit neuf fois plus que les séquences codant des protéines.
1. William Roy, Scott, and Walter Gilbert. “The Evolution of Spliceosomal Introns: Patterns, Puzzles and Progress.” Nature Reviews Genetics 7, no. 3 (March 2006): 211–21. https://doi.org/10.1038/nrg1807.