Subo hoy un vídeo más a la ya larga serie de vídeos de divulgación científica sobre genética que vengo preparando desde el principio de la pandemia COVID-19 utilizando piezas del TENTE, el mítico juego de construcción que muchos de mi generación y más jóvenes recordamos de pequeños con el que pasamos grandes ratos entreteniéndonos y desarrollando nuestra creatividad. Con este nuevo vídeo, que hace ya el número 21 en la lista BIOTENTE, he querido explicar cómo hemos podido reconstruir las proteínas CRISPR-Cas ancestrales, de decenas, centenares y hasta miles de millones de años de antiguedad. Los resultados del estudio colaborativo al que me refiero aparecieron publicados en la revista Nature Microbiology.
Ante la evidente falta de registro fósil ni de restos orgánicos de ningún tipo a partir de los cuales poder obtener ADN de tantos millones de años atrás tuvimos que acudir a técnicas alternativas, que usan la potencia de cálculo de grandes superordenadores y métodos estadísticos para inferir cuáles podrían haber sido las proteínas CRISPR-Cas antecesoras, que debieron existir en bacterias que vivieron hace muchos millones de años, partiendo de la diversidad de secuencias de estas mismas proteínas en un conjunto de bacterias actuales, evolutivamente relacionadas.
Es este nuevo vídeo convierto las piezas del TENTE de colores en aminoácidos, las unidades que forman las proteínas. En realidad son 20 los aminoácidos que podemos encontrar en las proteínas de cualquier ser vivo. Pero yo solamente tengo ocho colores de piezas de TENTE. Por lo tanto el vídeo es una aproximación simplificada, con proteínas formadas por solamente 8 tipos de aminoácidos (en lugar de 20), aunque para la explicación bastan y sirven igual.
Usando los ladrillos de TENTE de colores podemos constatar que las cuatro proteínas Cas actuales del ejemplo (en el gráfico adjunto y en el vídeo) están relacionadas dos a dos. Las podemos agrupar en dos grupos de dos, debido a su similitud. Con apenas pocos cambios podemos pasar de la una a la otra. Si esta misma información se la facilitamos a un ordenador y le pedimos que aplique el método de máxima verosimilitud entonces nos encontrará la proteína más probable ancestral que pudo haber dado lugar a las dos proteínas actuales que son similares (porque comparten un origen común). Y esto lo podemos hacer en los dos grupos de dos proteínas.
Al ordenador le podemos pedir seguidamente que busque la proteína más probable ancestral que pudo dar lugar a estas dos proteínas ancestrales que acaba de obtener. En realidad le estamos pidiendo consecutivamente que vaya regresando al pasado y nos describa las proteínas ancestrales (de otras ancestrales) que puedan llegar a explicar la variabilidad de secuencias de aminoácidos observadas en las proteínas Cas actuales. En efecto, el ordenador nos encuentra una proteína todavía más ancestral (más antigua) que puede dar lugar a las ancestrales anteriormente obtenidas y estas a las proteínas Cas observadas en las bacterias actuales.
El ejemplo solamente muestra dos etapas del proceso. Pero si vamos aplicando el mismo método, hacia atrás, podemos llegar a alejarnos mucho del presente y obtener proteínas de bacterias que debieron vivir hace decenas, centenares y hasta miles de millones de años. Así es como se revitalizan, se reconstruyen, se resucitan las proteínas CRISPR-Cas ancestrales.