13.1:
Relations phylogéniques par comparaison génomique
Genome comparison is one of the excellent ways to interpret the evolutionary relationships between organisms. The basic principle of genome comparison is that if two species share a common feature, it is likely encoded by the DNA sequence conserved between both species. The advent of genome sequencing technologies in the late 20th century enabled scientists to understand the concept of conservation of domains between species and helped them to deduce evolutionary relationships across diverse organisms.
Genome comparison can reveal three levels of evolutionary relationships. The first level provides deep insight into sequences and protein domains that are conserved across diverse groups of organisms, such as humans and fishes. The second level increases the resolution further to identify the unique DNA elements present in the closely related species, such as humans and chimpanzees. The third level with even higher data resolution distinguishes the genetic differences within a species, such as different variants and subtypes of an organism. This high-level resolution may identify mutations particular to individual microbial strains or clusters of infected cases, helping to track the disease outbreaks.
Several methods can be used to obtain the DNA sequence data required to deduce evolutionary relationships. Among them, whole-genome sequencing or WGS is a widely used technique. It provides high-resolution data extremely helpful to analyze mutations and conserved sequences among several organisms. It can also identify the cause of genetic disorders by comparing the DNA sequence of affected individuals to those of other unaffected subjects.
The data obtained by WGS or similar sequencing methods is analyzed by appropriate software tools to deduce evolutionary relationships. Molecular Evolutionary Genetics Analysis (MEGA) is one of the most widely used software tools. The programs present in the MEGA, such as assembly sequence alignment, building evolutionary trees, estimating genetic distances, and computation of evolutionary time trees, allow the users to curate and interpret the raw data obtained from sequencing techniques.
La classification traditionnelle des organismes de Linné est appelée cladistique, qui est basée sur les différences dans les caractéristiques physiques de l’organisme, et les scientifiques ont généralement construit des arbres, appelés dendrogrammes, pour donner des représentations visuelles de ces divisions et groupes.
Cependant, avec l’avènement de la technologie moderne, la comparaison de l’ADN est devenue un moyen courant de construire de tels arbres. Si les données de séquence sont examinées à travers une seule espèce, comme les humains, il existe un très haut degré de similitude dans le code génétique, environ 99,9 % parce que le code génétique d’un organisme est transmis du parent à la progéniture.
Les humains partagent également une grande partie de ce code ADN avec d’autres espèces, comme les chimpanzés et les souris, mais le degré de similitude globale entre l’ADN humain et le leur est significativement différent. Cela signifie que des arbres peuvent être créés pour des groupes d’espèces en fonction des similitudes ou des différences entre leurs codes génétiques. Ce domaine d’analyse, combinant les statistiques, la modélisation mathématique et l’informatique, fait partie d’un domaine connu sous le nom de bioinformatique.
Les données génétiques utilisées pour créer ces arbres peuvent prendre de nombreuses formes. Par exemple, en phylogénie moléculaire, un ou deux loci génétiques clés sont séquencés, puis comparés entre les espèces d’intérêt.
Cependant, comme des gènes individuels ou des régions génétiques peuvent évoluer à des rythmes très différents chez différentes espèces ou même être échangés entre différentes espèces par transfert horizontal de gènes, ces études génétiques à petite échelle peuvent ne pas toujours fournir des phylogénies précises.
Dans les phylogénies bactériennes, une technique appelée typage de séquences multilocus, ou MLST, est souvent utilisée. Cette méthode génère des séquences dans plusieurs régions génétiques – généralement des gènes de ménage qui sont essentiels à la fonction cellulaire et sont donc conservés à travers les espèces.
Cependant, les gènes de ménage peuvent évoluer lentement, par conséquent, avec MLST, il est difficile d’obtenir une résolution au niveau de la souche.
Enfin, le séquençage du génome entier, ou WGS, peut être utilisé pour élucider les relations évolutives. Cette méthode implique le séquençage du génome complet d’un organisme, y compris l’ADN mitochondrial chez les eucaryotes, et même l’ADN des chloroplastes chez les plantes.
Le WGS aligne l’ensemble des génomes à une résolution à petite échelle et peut identifier des mutations ou des marqueurs spécifiques à une espèce, des points de ramification et même des souches ou des populations d’une seule espèce. De tels détails peuvent être manqués dans un séquençage plus ciblé.
Related Videos
Genomes and Evolution
5.6K Vues
Genomes and Evolution
4.1K Vues
Genomes and Evolution
5.7K Vues
Genomes and Evolution
3.2K Vues
Genomes and Evolution
3.9K Vues
Genomes and Evolution
6.0K Vues
Genomes and Evolution
3.5K Vues
Genomes and Evolution
16.9K Vues