¿Qué nos ha traído Dios?

Por Lluis Montoliu, el 3 septiembre, 2022. Categoría(s): divulgación científica • edición genética • genética • genoma • historia de la ciencia ✎ 4
Esquema gráfico del sistema de codificación basado en CRISPR en las herramientas de edición de calidad (prime editing) que han diseñado Junhong Choi y colaboradores, descrito en la revista Nature. Esquema: Parte de la Figura 1 del artículo.

Las herramientas CRISPR de edición genética son un pozo sin fondo de aplicaciones, a cuál más diversa y sorprendente. Quienes me seguís recordaréis que suelo decir que el límite está en la imaginación de los investigadores. Y, claro, esta es desbordante, infinita, lo cual genera multitud de nuevas ideas y funcionalidades que derivan del uso de estas tijeras genéticas programables que antaño se inventaron las bacterias para defenderse de los virus que querían infectarlas. Son tantas las novedades que aparecen regularmente sobre CRISPR que cuesta mucho intentar estar al día. En esta entrada me voy a referir a un artículo, que apareció publicado en la revista Nature el pasado mes de julio, en el que un grupo de investigadores desarrolla un nuevo sistema de codificación de información basado precisamente en las herramientas CRISPR, explotando su mecanismo de acción, conociendo al detalle cómo realizan su función.

Usar las CRISPR para codificar información, de todo tipo, como pueden ser imágenes o películas, no es nuevo. El inefable investigador y visionario George Church ya sorprendió a propios y a extraños en 2017 con una propuesta impactante que aprovechaba no la capacidad de corte/ataque de los sistemas CRISPR, sino su capacidad para capturar partes del genoma de virus invasores, convirtiéndolos en los segmentos espaciadores que se ubican en el genoma de las bacterias entre las repeticiones CRISPR. Esos espaciadores, en lugar de contener fragmentos del ADN del virus pasaron a transportar un conjunto de instrucciones (usando las cuatro letras del ADN: A, T, G, C) que contenían información, como las coordenadas del pixel, el número de fotograma y el nivel de color de gris de una pequeña secuencia cinematográfica, que podían ser reconstruidos simplemente leyendo el genoma de estas bacterias, ahora convertidas en una especie de dispositivo biológico similar a las llaves USB de memoria. El increíble artículo de Church también sirvió para ilustrar como los grandes investigadores no se contentan solamente con demostrar su hipótesis de trabajo, siguiendo el método científico, sino que intentan añadir algo más, algo de poesía, de literatura, en definitiva de cultura, a sus avances científicos. Los cinco fotogramas cuyos pixeles digitalizó Church usando una estrategia CRISPR correspondían no a una película cualquiera, sino a la primera película de la que se tiene constancia histórica, precursora de la cinematografía, filmada en 1878 por Eadweard Muybridge (pseudónimo de Edward James Muggeridge), fotógrafo británico que emigró a los EEUU. De hecho se considera la primera película que fue grabada como tal, para dilucidar si había algún momento en el que los caballos al galope tenían sus cuatro patas suspendidas en el aire (como es el caso). He contado este episodio de la historia de las CRISPR en mi libro «Editando genes: recorta, pega y colorea. Las maravillosas herramientas CRISPR«, publicado por Next Door Publishers en 2019 y cuya tercera edición lanzamos en 2021. Podéis ver aquí un vídeo donde se explica este artículo de Church.

Reproducción de los cinco fotogramas de la película de Eadweard Muybridge digitalizados por George Church mediante CRISPR. A la izquierda los fotogramas originales. A la derecha los fotogramas codificados mediante CRISPR Fuente: Nature.

Este nuevo artículo al que dedico esta entrada en el blog, también publicado en la revista Nature, cinco años después, explora nuevamente la posibilidad de codificar información usando los sistemas CRISPR-Cas9 de edición genética. Pero lo hace de una forma diferente, muy ingeniosa, aprovechando esta vez su capacidad de corte de moléculas de ADN, guiada por pequeñas moléculas de ARN que dirigen a la nucleasa Cas9 al lugar preciso del genoma donde se quiere introducir ese corte en la doble cadena del ADN, que inmediatamente deberá ser reparado por los sistemas endógenos de reparación de la célula. Este es un experimento relativamente complejo, para lo cual debo refrescarte cómo funcionan los sistemas CRISPR-Cas9 como herramientas de edición genética. Usaré unos gráficos que preparé para ilustrar la página web que preparé sobre CRISPR en el CNB, y que recopìla lo acontecido durante los primeros años de esta revolución metodológica.

Esquema que muestra el mecanismo de corte que realiza la nucleasa Cas9 (en amarillo) sobre la doble cadena del ADN (en negro), guiada por una pequeña molécula de ARN (sgRNA, en azul), que localiza la secuencia complementaria en el ADN que debe estar exactmente adyacente a una pequeña secuencia de tres letras, llamada PAM (en verde), característica de cada nucleasa Cas (es NGG para la Cas9 de Streptococcus pyogenes, la más utilizada). Finalmente el complejo corta la doble cadena del ADN (triángulos rojos) en una posición muy precisa, exactamente tres letras antes de la secuencia PAM. Dibujo: Lluís Montoliu.

Sin embargo, esta nueva codificación de información usando herramientas CRISPR no se realiza con la versión original de estas herramientas de edición genética, ilustrada en el esquema anterior, sino con una de sus últimas versiones, desarrollada por el desbordante talento de David Liu, llamada «Prime editing» o edición de calidad. Esta nueva variante, lanzada en 2019, pretende resolver algunos de los problemas de especificidad y mosaicismo habitualmente asociados al uso de las herramientas CRISPR-Cas9 tradicionales. Para empezar la nucleasa Cas9 no es la nucleasa original, sino una variante mutante, llamada nickasa (o nikasa/nicasa, del inglés nickase), que solamente es capaz de cortar una de las dos cadenas del ADN. La segunda modificación importante es que la pequeña molécula de ARN guía (sgRNA en la ilustración anterior) ahora ya no es tan pequeña, y la denominamos pegRNA. Por un lado esta molécula de ARN sigue apareándose en la secuencia complementaria del ADN, lo que le da la especificidad, pero por otro lado, en su otro extremo, crece hasta hacerse mucho más largo, hasta convertirse en una secuencia de ARN que ahora es complementaria a la otra cadena del ADN. Y esta complementariedad es aprovechada por un módulo adicional que se asocia a la nickasa: una transcriptasa reversa, la proteína que es capaz de generar ADN a partir de ARN, pudiendo imponer la secuencia de ADN que se generará a partir del molde de ARN que aporta el extremo largo de esta gúia de ARN llamada pegRNA. Por ejemplo para insertar nuevas letras en el ADN, que es la propiedad que usan estos investigadores en el desarrollo de su nuevo código.

Interpretración gráfica simplificada de la nueva herramienta quimérica CRISPR para PRIME EDITING (para editar con calidad). Basado en la publicación de David Liu en Nature (2019). Dibujo: Lluís Montoliu.

La herramienta CRISPR de edición de calidad, o prime editing, sigue teniendo naturalmente su secuencia PAM, por lo que seguimos necesitando esta medida de verificación para determinar dónde cortará la nickasa en el ADN, tres letras antes de la PAM (acrónimo del término en inglés, Protospacer Adjacent Motif, motivo adyacente al protoespaciador o secuencia diana de la Cas9). Esta secuencia PAM es un recuerdo de que las herramientas CRISPR tienen un origen biológico. Es lo que usan las bacterias para no suicidarse y cortar su propio genoma, que contiene los fragmentos del genoma del virus invasor, pues solamente se cortará esta secuencia de ADN si aparece al lado de la secuencia PAM característica, que está presente en el genoma del virus pero no en el genoma de la bacteria. Recordad que las guías no incluyen la secuencia PAM. Pues bien, ahora que sabemos quién es el protagonista (la herramienta de prime editing) veamos en algo más de detalles esta evolución de la propuesta de codificación de Church, corregida y aumentada. Veamos como estos investigadores han sido capaces, en este nuevo trabajo,  de convertir al ADN en un máquina de escribir para codificar mensajes complejos. o eventos celulares, en el mismo orden en el que ocurrieron.

Como todo trabajo intelectualmente complejo hay que leerlo varias veces. No os desaniméis si no lo entendéis en vuestra primera lectura. Leedlo de nuevo, sobre todo la figura 1, que encabeza esta entrada en el blog. Lo mismo aplica para esta entrada del blog, aunque espero que sea menos compleja. En el momento que lo entendáis obtendréis una satisfacción increíble, un buen chute de endorfinas que recompensará vuestro esfuerzo. Intentaré explicar a continuación cómo funciona este ingenioso sistema de codificación, usando el genoma como papel sobre el que escribir, y las letras del ADN como los elementos del sistema de codificación.

El origen del sistema es un tándem, una repetición de dos (o más) secuencias (dos monómeros) de 14 letras que representan la diana parcial de Cas9 (habitualmente la guía de ARN necesita 20 letras para aparearse con la secuencia complementaria del gen que se quiere editar) con sus dos extremos truncados. Le faltan tres letras a cada lado para ser diana de la secuencia guía del ARN (del pegRNA). Por lo tanto, al no tener la serie completa de letras se trata de secuencias inactivas. Estos tandems (con dos o más monómeros) se insertan en el genoma de células humanas en cultivo HEK293 usando el transposón piggyBAC. Dentro de esta secuencia de 14 letras hay una secuencia PAM que dirige la unión de Cas9 y permite que se active su corte en una de las cadenas (recordad que es una nickasa). De los dos elementos del tandem el segundo elemento es el que está truncado, mientras que el primero está completo e inicialmente es la única diana correcta disponible. En este momento es cuando aparece el editor de calidad (prime editing) que va a añadir 5 letras nuevas entre el final del primer elemento del tándem (el único activo) y el principio del segundo, que ahora se convierte en el monómero activo (el primero ya no lo es al truncarse la secuencia diana con la inserción de las cinco nuevas letras). De estos 5 bp hay dos variables NN (que pueden ser cualquiera de las cuatro letras A, G, C, T en las dos posiciones) y tres fijas, que son las que nos indicarán la posición de las dos letras variables adyacentes. Al insertar estas cinco letras el primer monómero deja de ser diana, y ahora la única disponible está en segunda posición. La primera ya desapareció. Y seguimos con el tercer monómero, el cuarto, etc… Así se puede construir una secuencia codificada de eventos (cada una con un pareja de letras NN distinta, de las que hay maturalmente 16 posibilidades [16=4×4]: AA, AG, AC, AT, GA, GG, GC, GT, CA, CG, CC, CT, TA, TG, TC, TT) perfectamente ordenada, que recupera la secuencia temporal también. Genial y sorprendente. Dado que cada evento de prime editing requiere que el anterior haya ocurrido antes para que se regenere la (misma) secuencia diana se pueden proporcionar , de una vez, todas las diferentes guías pegRNA y esperar que el experimento genere por secuencialidad todas las combinaciones posibles que esperamos, en el orden que hemos programado, con la secuencia prevista.  Y con un tasa de error relativamente baja <1% (por ejemplo, editar un determinado monómero sin que el anterior haya sido editado) y una tasa de éxito muy alta >99% (editar un tercer monómero sobre un tándem que tenga ya editados el segundo y el primero). Veámoslo en el siguiente gráfico para una mejor comprensión.

Esquema gráfico del proceso de codificación diseñado por estos investigadores, usando una misma guía de ARN pero con diferentes extremos pegRNA para poder introducir, en cada ronda, cinco letras en la misma posición, dos de ellas variables (en negro, cualquiera de las 16 combinaciones posibles) y tres fijas (en rojo), que representan el extremo de la guía. Cada monómero del tándem inicial es capaz de incorporar una parte de la información codificada en forma de estas dos letras variables, que se predefinen. En cada ronda solamente hay una PAM posible que flanquea una secuencia complementaria a las 20 letras que lleva la guía de ARN (en verde). Dibujo: Lluís Montoliu (basado en la Figura 1 del articulo de Choi y colaboradores).

Tal y como se puede apreciar en el esquema anterior, el ingenio de estos investigadores les lleva a usar diferentes pegRNA que tienen la misma guía ARN complementaria a la misma secuencia de 20 letras del ADN, pero con uno de los extremos distinto, el extremo opuesto al de la secuencia guía, capaz de insertar en el punto de corte secuencias de ADN de cinco letras de las cuales dos son variables (son las que portan la información, representadas por NN) y las otras tres representan la clave, la secuencia que necesita la guía ARN para aparearse correctamente en las 20 letras. En cada ronda solo hay un monómero posible que sea diana correcta y complementario a la guía del ARN y que se sitúe al lado de la correspondiente secuencia PAM de tres letras (en azul). Empezando por la izquierda las sucesivas inserciones de 5 letras van produciéndose ordenadamente. Por ejemplo, las tres rondas de inserción de NN del ejemplo podrían ser: AA-GT-CA, lo cual podría codificar una determinada información o señalar un estado determinado de la célula (las que han llegado con éxito a completar tres rondas sucesivas de modificación). Es impresionante, ¿no os parece?. Si todavía no entendéis cómo funciona este sistema (lo sé, es complejo), dadle una segunda oportunidad y volver a leer los párrafos anteriores y revisad de nuevo el dibujo.

Seguro que te habrás dado cuenta que con dos letras posibles (NN) solo podemos codificar 16 elementos distintos. Por ejemplo, si quisiéramos codificar las letras del alfabeto (28 letras) y los números, signos de puntuación, interrogación y exclamación correspondientes necesitaríamos un código más complejo y versátil. Es por ello que lo siguiente que hicieron estos investigadores fue aumentar el número de Ns de 2 hasta 3 (NNN). Y así con tres N el número de combinaciones posibles ya es de 64 [4x4x4 = 64]. Y si lo llevamos a insertar 6 Ns (NNNNNN) el número de combinaciones posibles asciende hasta 4096 posibles [4x4x4x4x4x4=4096). Por lo tanto, si ahora se procede a transfectar secuencialmente los pegRNAs distintos y asociamos cada NNN a un símbolo (una letra del alfabeto, un carácter de puntuación, un número,….) podemos «escribir» sobre el ADN frases tan complejas como queramos basadas en un tándem que deberá tener tantos monómeros como caracteres tendrá nuestra frase. ¿Es o no es sorprendente?

Seguro que te estarás preguntando por el título de esta entrada en el blog. La poesía, el ingenio, la cultura nunca debe faltar en la buena ciencia, y la primera frase que estos autores se propusieron transmitir usando su nuevo sistema de codificación con CRISPR y prime editing no fue una frase cualquiera. Fue la siguiente frase: «WHAT HATH GOD WROUGHT?» (¿Qué nos ha traído Dios?). Esta es una frase de la Biblia (del Antiguo Testamento, libro de Números 23:23) y fue el primer mensaje que se transmitió mediante el código Morse en 1844.

Los investigadores no se quedaron ahí. La segunda frase que decidieron codificar mediante CRISPR y prime editing fue «MR. WATSON, COME HERE!» (¡Señor Watson, venga aquí!) que fue el primer mensaje transmitido por teléfono en 1876, la primera llamada que hizo Alexander Graham Bell a su ayudante Thomas A. Watson el 10 de marzo de 1876. Y para la tercera frase escogieron el texto «BOUND FOREVER, DNA» que es parte de la letra de la canción titulada «DNA» de 2017 de un grupo llamado BTS (los Bangtang Boys, de Corea del Sur).

Por supuesto no es oro todo lo que reluce. El sistema tiene muchos matices y peros. Por ejemplo, la eficiencia de edición por prime editing no es equivalente según cada pegRNA y cada contexto, por lo que determinados caracteres pueden estar infrarepresentados y otros sobrerepresentados. Y también pueden darse ediciones erróneas de monómeros inactivos, con baja probabilidad, pero pueden darse, lo cual corrompe y altera el mensaje. Es decir, no es todavía un sistema de codificación perfecto e infalible, pero es una nueva aplicación, con mucha imaginación e ingenio, de los sistemas CRISPR.

Reconstrucción de las relaciones de linaje entre diferentes células únicas en un cultivo celular mediante el sistema de codificación CRISPR con prime editing basado en cinco mónomeros. Esquema: figura 5 del artículo Choi et al. Nature, 2022.

¿Y todo esto para qué sirve? (además de para jugar con el ADN y codificar mensajes de texto en el genoma). Pues por ejemplo para análisis de linajes celulares. En una población de células en cultivo no todas las células son iguales , hay una cierta heterogeneidad. Y podemos analizarla transfectando un cultivo celular con uno de estos tándems (insertado por ejemplo mediante lentivirus, que llegará a la práctica totalidad de las células) y luego volcar todo el sistema de prime editing y los diferentes pegRNAs para dejar a las células realizar las diversas rondas de edición. Finalmente, leyendo y analizando las secuencias que tengan miles de células únicas sus secuencias editadas nos permitirán situarlas en un complejo árbol de pedigree, que permitirá relacionarlas unas con otras, estableciendo incluso un orden temporal de cada una de las inserciones. Servirá para estudiar la dinámica y diversidad de los cultivos celulares, un aspecto difícil de analizar hasta ahora, pero que gracias a este ingenioso truco con CRISPR y prime editing puede ahora investigarse. Voilà!



4 Comentarios

  1. ¡El genio humano! Esta técnica puede suponer el espaldarazo no solo al almacenamiento de información usando ácidos nucleicos, sino también a la computación basada en ellos.
    Saludos,

    Juan Carlos—
    @ApuntesCiencia

    1. En efecto Juan Carlos, apenas empezamos a vislumbrar las aplicaciones que pueden derivarse de este nuevo sistema de codificación, basado en CRISPR.
      Saludos!

  2. Apuntar una pequeña errata en «[4x4x4x4x4x6=4096)», pues parece haberse colado el 6 antes del signo = en lugar de otro 4.

    Un sAludo y se AGrAdeCe el ArTíCulo

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.