많은 다른 종 간에 보존되는 뉴클레오티드 서열을 다종 보존 서열(multi-species conserved sequence)이라고 합니다.
예를 들어, 인간, 쥐 및 생쥐 사이에는 수천 개의 DNA 분절이 있으며, 이 세 종이 공통 포유류 조상에서 갈라진 이래로 변하지 않았습니다.
이러한 보존된 염기서열 중 소수는 RNA 또는 단백질을 암호화하지만, 대다수는 보존된 비유전자 염기서열 또는 CNG라고도 하는 비암호화 DNA 염기서열입니다. 예를 들어, 보존된 인간 및 마우스 게놈 염기서열 중 1/3만이 기능적 전사체를 생성하고 나머지 2/3는 CNG입니다.
CNG는 길이가 약 50-200개의 뉴클레오티드이며 게놈의 유전자 간 영역, 유전자 내 인트론 또는 RNA 전사체의 번역되지 않은 영역에서 발견될 수 있습니다.
이러한 염기서열 중 일부는 계통에 걸쳐 극도로 보존되어 있으므로 초보존 염기서열이라고 합니다. 인간, 쥐 및 생쥐 게놈 사이에는 5000개 이상의 초보존 염기서열이 있으며, 각 게놈의 길이는 약 100개입니다.
혈통에 걸쳐 수백만 년에 걸쳐 염기서열이 보존되어 있다는 것은 여러 종의 보존된 염기서열이 생존에 결정적임에 틀림없다는 것을 나타낸다. 그러나 대부분의 보존된 염기서열은 단백질을 암호화하지 않기 때문에 그 기능은 여전히 미스터리로 남아 있습니다.
이러한 보존된 서열은 다음과 같은 몇 가지 기능을 갖는 것으로 추측됩니다. 첫째, 이러한 염기서열은 전사 기계에 결합하고 유전자 발현 수준을 제어하는 인핸서 또는 소음기로 작용할 수 있습니다.
둘째, 보존된 염기서열은 mRNA 전 성숙 및 안정성을 조절하는 긴 비암호화 RNA로 전사될 수 있습니다.
셋째, 이러한 염기서열은 염색체 간의 기능적 상호작용을 가능하게 하고 핵 내에서 뚜렷한 유전자 발현 패턴을 가진 염색체 영역을 정의하는 데 도움이 될 수 있습니다.
여러 종의 보존 염기서열에서 드문 돌연변이는 일반적으로 새로운 종의 진화에 중요한 단계를 나타냅니다.
예를 들어, 영장류 게놈은 신경 발달 유전자 근처에서 고도로 보존된 특정 염기서열을 포함합니다. 약 600만 년 전, 이 보존된 염기서열은 이례적인 속도로 뉴클레오티드 변화를 겪었고 이는 인간 혈통의 진화로 이어졌습니다.
인간 가속 영역(Human Accelerated Regions, HAR)이라고 불리는 이 영역은 뇌 발달과 인지 기능 향상의 중요한 단계에 관여합니다.