El tamaño de nuestro genoma

Por Lluis Montoliu, el 23 noviembre, 2020. Categoría(s): divulgación científica • expresión génica • genética • historia de la ciencia ✎ 18
Representación gráfica del conjunto de cromosomas humanos de referencia (cariotipo) junto al ADN mitocondrial. Fuente: NCBI

¿Cuál es el tamaño del genoma humano? ¿Cómo de grande o de largo es nuestro genoma? ¿Cuánto ADN tenemos en nuestras células? ¿Cuantas letras caben dentro de cada uno de nuestros núcleos? Intentar responder a estas preguntas, en apariencia sencillas, es bastante más complicado de lo que parece. Habitualmente usamos aproximaciones y nos referimos a cifras redondeadas simplificadas (p.e. ~3.000 millones de letras), que manejamos en charlas y textos de divulgación, pero deberíamos saber y poder responder, con mayor exactitud científica, a estas preguntas. En este artículo encontrarás algunas respuestas.

Para empezar definamos qué entendemos por genoma humano. ¿Nos referimos al ADN que tenemos en el núcleo de cada una de nuestras células? ¿O queremos referirnos a un genoma de referencia arbitrario que usamos los investigadores para comparar cada una de nuestras secuencias, para comprobar qué variantes genéticas tenemos en tal o cual posición?

El ADN de nuestras células reside principalmente en el núcleo, pero también existe ADN dentro de algunos orgánulos subcelulares, como las mitocondrias, vestigio de su origen procariótico, cuando varias bacterias se fusionaron y dieron lugar a la célula eucariota, como recogió la teoría endosimbiótica propuesta por Lynn Margulis en 1967. Por lo tanto, si queremos contabilizar el ADN deberemos contar tanto el que tenemos en el núcleo como el que tenemos en las mitocondrias, una molécula de ADN circular cuyo tamaño es mucho más pequeño, tiene menos de 20.000 pares de bases (exactamente 16.569).

Cada una de nuestras células, somáticas, tiene 23 pares de cromosomas: 22 pares de cromosomas autosómicos (del 1 al 22) y un último par de cromosomas sexuales, que diferencia al sexo femenino (XX) del sexo masculino (XY). De cada par de cromosomas heredamos una copia de nuestra madre y otra copia de nuestro padre. Esto suele representarse como 46XX, para individuos de sexo femenino, y 46XY, para individuos de sexo masculino. Por lo tanto, de entrada, parece obvio que el ADN de un individuo de sexo masculino (que solo tiene una copia del cromosoma X, pero tiene una copia también del cromosoma Y) será algo distinto de un individuo de sexo femenino (que tiene dos copias del cromosoma X, y no tiene las secuencias correspondientes al cromosoma Y).

Primer problema: ¿Cuando hablamos del genoma humano, nos referimos al genoma de individuos de sexo masculino o de individuos de sexo femenino?

Este primer problema se resuelve de forma arbitraria. Hemos acordado que el genoma humano de referencia tendrá una copia de cada uno de los cromosomas autosómicos (del 1 al 22), una copia del cromosoma X, una copia del cromosoma Y y el ADN mitocondrial. A la suma de todo ello le llamaremos genoma humano. Esto es un genoma reconstruido artificialmente, que usamos para trabajar en genética. Pero esto no es ni el genoma que tienen las células de sexo masculino, ni el genoma que tienen las células de sexo femenino. Es un compendio de letras arbitrario, que nos sirve de referencia para comparar tanto secuencias de ADN de individuos de sexo masculino como secuencias de ADN de individuos de sexo femenino.

Representación gráfica de la estructura de la molécula de ADN, una doble cadena antiparalela y dextrógira, con sus bases nitrogenadas (Purinas: Adenina y Guanina, y Pirimidinas: Timina y Citosina), y su surco mayor (major groove) y surco menor (minor grove). Dibujo: Wikipedia Commons, by Zephiris.

Segundo problema: ¿Qué tamaño tiene el genoma humano de referencia?

El ADN es una molécula bicatenaria. Son dos cadenas antiparalelas (la cadena de «arriba» se lee de izquierda a derecha, y la de «abajo» se lee de derecha a izquierda) y complementarias, que giran a la derecha (dextrógira) formando una doble hélice. La estructura de la molécula del ADN fue deducida por James Watson y Francis Crick en 1953, a partir de fotografías de difracción de rayos X obtenidas por Rosalind Franklin y Maurice Wilkins. El ADN está formado por cuatro de letras (de nucleótidos) a los cuales nos referimos habitualmente por el nombre de las bases nitrogenadas que los forman: adenina (A), timina (T), guanina (G) y citosina (C). La A siempre se aparea con la T y la G siempre se aparea con la C. Por lo que conociendo la secuencia de letras (de nucleótidos) de una de las cadenas del ADN inmediatamente podemos deducir la secuencia de la cadena complementaria. La unidad del ADN es el «par de bases» (formado por un nucleótido frente a otro, complementario), y a pesar de ser dos letras la información que portan es redundante. Basta una de las dos letras para deducir la complementaria. Por lo tanto tendemos a referirnos a ~3.000 millones de letras (o nucleótidos) como tamaño de nuestro genoma, cuando en realidad queremos decir ~3.000 millones de pares de bases (que, sensu stricto, corresponderían a 6.000 millones de letras, dado que cada par de bases contiene dos letras, dos nucléotidos).

Las dos cadenas antiparalelas y complementarias de una molécula de ADN con sus cuatro nucleótidos constituyentes: A, T, G y C. A cada letra (nucleótido) situada frente a su complementaria se le llama un «par de bases». Dibujo: Lluís Montoliu

Tercer problema: ¿Es correcto referirnos a 3.000 millones de letras como el tamaño de nuestro genoma?

En realidad esta cifra, 3.000 millones de letras (de nucléotidos, cuando en realidad lo que queremos decir es «de pares de bases») es una aproximación. Es fácil de recordar (un 3 seguido de 9 ceros) y fácil de transmitir. Los anglosajones se refieren a ella como 3 billions (3 billones, de los suyos, para ellos un billón son mil millones, para nosotros un billón es un millón de millones). Pero no se corresponde exactamente con el tamaño del genoma de referencia. Si consultamos la base de datos de NCBI y sumamos el tamaño de cada uno de los 22 cromosomas autosómicos (del 1 al 22), más el tamaño de un cromosoma X, más el tamaño de un cromosoma Y, más el tamaño del ADN mitocondrial, más las secuencias de ADN que no han podido asignarse a ningún cromosoma (un 5,6% del total) a partir de la última versión del ensamblado del genoma humano de referencia (GRCh38.p13) nos saldrá la cifra de 3.272,12 Mb (Megabases, o millones de pares de bases). En realidad, el genoma humano de referencia actual son exactamente 3.272.116.950 pares de bases, es decir, corresponden a 6.544.233.900 letras totales o nucleótidos. Pero esta cifra, que usamos como genoma humano de referencia, de nuevo, no es el tamaño del ADN que tenemos en nuestras células. Veamos por qué.

Cuarto problema: ¿Cuánto ADN tienen las células de los individuos de sexo femenino y los de sexo masculino?

Recordemos que nuestras células somáticas son diploides. Eso quiere decir que tenemos dos copias de cada cromosoma, una heredada del padre y otra de la madre, 22 pares de cromosomas autosómicos y un par de cromosomas sexuales, que representamos como 46XX para individuos de sexo femenino y 46XY para individuos de sexo masculino. Y, además, las dos copias de cada cromosoma no son idénticas. De cada gen tenemos la variante genética que hemos heredado de nuestro padre y la otra variante genética que hemos heredado de nuestra madre. En Genética hablamos de dos alelos diferentes para cada gen que da lugar a situaciones de homocigosis (cuando los alelos son iguales), o de heterocigosis (cuando los alelos son distintos). En general, para la gran mayoría de genes, mientras tengamos una de las dos copias funcional vamos bien. Cuando las dos copias heredadas incluyen mutaciones que interfieren con la función del gen y/o de la proteína codificada es cuando se da la patología, enfermedad o condición genética, que suele ser de baja prevalencia, y a la que solemos llamar enfermedades raras. Por lo tanto tendremos que incluir las dos copias si queremos contabilizar el tamaño total del genoma que tenemos en nuestras células. Y esta contabilización deberemos hacerla de forma distinta para los individuos de distinto sexo. Para resolver este cuarto problema tenemos que obtener el tamaño exacto de cada cromosoma y del ADN mitocondrial, junto con las secuencias de ADN adicionales no asignadas a ningún cromosoma. Veamos la siguiente tabla.

Longitud de cada cromosoma humano (versión GRCh38.p13). Fuente: NCBI

Así pues, ahora tenemos el tamaño de cada cromosoma y podemos calcular el tamaño del genoma de los individuos de cada sexo, teniendo en cuenta su cariotipo: 46XX o 46XY.

El tamaño del genoma en las células somáticas de individuos de sexo femenino (46XX)

Sumaremos el tamaño (en pares de bases) de los 22 cromosomas autosómicos (2.875.001.522), lo multiplicaremos por dos para tener en cuenta las dos copias de cada uno de los cromosomas autosómicos (5.750.003.044), le añadiremos la longitud de dos cromosomas X (312.081.790), le añadiremos el ADN mitocondrial (16.569) y dos copias de las secuencias no asignadas (367.661.098) y el resultado final es de 6.429.762.501 pares de bases, es decir (multiplicando por dos, para tener el número total de letras) 12.859.525.002 de nucleótidos.

El tamaño del genoma en las células somáticas de individuos de sexo masculino (46XY)

Sumaremos el tamaño (en pares de bases) de los 22 cromosomas autosómicos (2.875.001.522), lo multiplicaremos por dos para tener en cuenta las dos copias de cada uno de los cromosomas autosómicos (5.750.003.044), le añadiremos la longitud de un cromosoma X (156.040.895), le añadiremos la longitud de un cromosoma Y (57.227.415), le añadiremos el ADN mitocondrial (16.569) y dos copias de las secuencias no asignadas (367.661.098) y el resultado final es de 6.330.949.021 pares de bases, es decir (multiplicando por dos, para tener el número total de letras) 12.661.898.042 de nucleótidos, un tamaño ligeramente menor (un 1,53% menos) que el de los individuos de sexo femenino.

Conclusión final

Es importante darse cuenta que ante la pregunta de cuál es el tamaño del genoma humano hay múltiples respuestas posibles que he intentado desgranar en este artículo. Este tema ha sido objeto ya de debate en publicaciones y por parte de empresas del sector de secuenciación genómica, que inciden en subrayar que cuando nos referimos a 3.000 millones de letras como tamaño de nuestro genoma solo estamos contando una parte de la historia.

Una aproximación más realista sería decir que nuestro genoma de referencia corresponde a ~3.300 millones de pares de pares (o ~6.500 millones de nucleótidos).

Y si queremos referirnos al tamaño de nuestro genoma total en una célula diploide, este correspondería a ~6.400 millones de pares de pares (o ~12.800 millones de nucleótidos) en individuos de sexo femenino (46XX), y a ~6.300 millones de bases (~12.600 millones de nucleótidos) en individuos de sexo masculino (46XY).

Finalmente, hay que recordar que ninguna de estas cifras es definitiva ni inmutable. El genoma humano se sigue revisando y periódicamente se obtienen nuevos ensamblajes y se sitúan secuencias no asignadas en la posición que le corresponde en alguno de los cromosomas, o se corrigen otras regiones que habían sido mal ensambladas. Hay muchas secuencias y elementos del ADN repetitivos (como los transposones y retrotransposones, de los que ha hablado Guillermo Peris en Naukas en varias ocasiones: 1, 2, 3) que complican las labores de ensamblaje de fragmentos secuenciados que llevan a cabo los programas bioinformáticos. Por ejemplo, todos los archivos de secuencias de los cromosomas humanos que he usado en este artículo estaban revisados a fecha de 17 de agosto de 2020. Quizás de aquí a algún tiempo varien. Esto habrá que tenerlo en cuenta. Por eso hay que indicar siempre la versión del genoma humano a la que nos referimos.



18 Comentarios

  1. Pues la verdad tengo que reconocer que es un matiz que no lo he visto en muchas partes. Sabemos de la diferencia de nucleotidos por la diferencia de los cromosomas X e Y pero no ponemos el matiz en esa diferencia cuando lo englobamos todo en el genoma humano y es importante tenerla en cuenta e indicarla. Gracias.

    1. Una persona con síndrome de Down tiene (generalmente) tres copias íntegras del cromosoma 21. Si es un individuo de sexo femenino su cariotipo se representa por 47XX+21. Si es un individuo de sexo masculino su cariotipo se representa por 47XY+21. Una persona con el síndrome de Turner solo tiene una copia del cromosoma X (y, generalmente, no tiene cromosoma Y) y se representa como 45X. Una persona con síndrome de Klinefelter generalmente posee dos cromosomas X y un cromosoma Y y se representa como 47XXY. Los tamaños de los genomas respectivos de las células de estas personas, en pares de bases (y en nucleótidos) se indican a continuación:
      47XX+21 = 6.476.472.484 pares de bases (12.952.944.968 nucleótidos)
      47XY+21 = 6.377.659.004 pares de bases (12.755.318.008 nucelótidos)
      45X = 6.273.721.606 pares de bases (12.547.443.212 nucleótidos)
      47XXY = 6.486.989.916 pares de bases (12.973.979.832 nucleótidos)

      1. Sumamente útil, esta información me sirve para calcular aproximadamente el material genético definitivo que podría combinarse en la gametogénesis despues de las meiosis y luengo en el cigoto ante de comenzar su primera división mitotica.

  2. ¿Y sería correcto incluir en el genoma humano el microbioma asociado en vista de la importancia que se ha demostrado que tiene en el correcto funcionamiento de tantos procesos fisiológicos?

    1. Si quisiera contabilizar todos los genomas que coexisten en una persona sí, pero nuestro genoma y el de las bacterias, arqueas y protistas que pueblan nuestro cuerpo son entidades diferentes.

      1. Bueno Luis, tu sabes que ese es un cálculo basado en lo que han venido haciendo los investigadores de laboratorio y nos basamos en sus parámetros porque confiamos en ellos y en las múltiples comprobaciones de quienes siguen este tipo investigaciones microscópicas de alta complejidad. Por tanto tus aportes teóricos en ese campo son extremadamente útiles. Gracias.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.