Si bien todos los organismos vivos tienen un genoma de algún tipo (ya sea ARN o ADN), existe una variación considerable en los tamaños de estos planos. Un factor importante que afecta el tamaño del genoma es si el organismo es procariota o eucariota. En los procariotas, el genoma contiene poca o ninguna secuencia no codificante, de modo que los genes están estrechamente agrupados en grupos u operones secuencialmente a lo largo del cromosoma. Por el contrario, los genes de los eucariotas están puntuados por largos tramos de secuencia no codificante. En general, esto contribuye al fenómeno de que los genomas procariotas tienden a ser más pequeños (es decir, contienen menos bases) en promedio que los de los eucariotas.
Como era de esperar, dada esta observación, los genomas más pequeños conocidos son en su mayoría procariotas. Candidatus Carsonella rudii, por ejemplo, es una proteobacteria muy simplificada que tiene un tamaño de genoma de solo 160 mil pares de bases. Habiendo perdido muchos genes que necesitaba para sintetizar proteínas esenciales para la vida, ha evolucionado hasta convertirse en un simbionte intracelular obligado. En el extremo opuesto del espectro, la planta con flores japonesa eucariota Paris japonica es uno de los genomas más grandes conocidos, con alrededor de 150 mil millones de pares de bases. Aunque no se conoce el número de genes que codifica, el genoma muestra grandes cantidades de duplicación y secuencias no codificantes.
Dentro del genoma de un procariota promedio hay aproximadamente 3.000 genes. El eucariota promedio tiene alrededor de 20,000. Pero el tamaño del genoma, especialmente en los eucariotas, es muy variable, en gran parte debido a la cantidad de secuencias no codificantes.
La creación de nuevos genes
Con el fin de desarrollar nuevos genes, los organismos tienen algunas opciones principales. Lo único que la mayoría de ellos tienen en común es que modifican secuencias que ya existen.
La duplicación juega un papel importante en la creación de nuevos genes, y hay algunos tipos de duplicación que pueden dar lugar a estas nuevas secuencias. En la duplicación de genes, se duplica una sección de ADN que contiene un gen. Esta segunda copia no se enfrenta a la presión de selección que constriñe a la primera, por lo que puede divergir. Con el tiempo, esto puede conducir a la evolución de nuevos genes, con nuevas funciones.
Otro tipo de duplicación, el barajado de ADN, puede dar lugar a que solo una sección de un gen se duplique y se una a otro gen. Esto puede dar lugar a la creación de nuevos genes, con productos novedosos.
A veces, los nuevos genes simplemente evolucionan a partir de mutaciones acumuladas a lo largo del tiempo. Esto se conoce como mutación intragénica y es más notable cuando se compara entre especies o poblaciones divergentes.
Por último, también es posible obtener nuevos genes a partir de fuentes externas, en un proceso conocido como transferencia horizontal de genes. Esto significa que se puede incorporar material genético de otros individuos, a veces de la misma especie, pero también potencialmente de otra especie por completo. Esta es una fuente frecuente de genes nuevos en procariotas y arqueas. Es menos común en los eucariotas, pero se ha demostrado que ocurre, y los eucariotas pueden incluso recoger información genética de fuentes tan distantes como bacterias u hongos.