La mitad de nuestro genoma es basura, pero podría ayudar al estudio del cáncer

genoma

genoma

Secuencia de ADN.
Shutterstock / Gio.tto

Xose Antón Suárez Puente, Universidad de Oviedo y Pablo Bousquets Muñoz, Universidad de Oviedo

Resulta extraño que gran parte del genoma que contiene las instrucciones para elaborar organismos tan fascinantes como las elegantes mariposas monarca que todos los años migran a México a pasar el invierno, o los propios humanos, con su capacidad para resolver problemas, se asemeje más a un vertedero que a los pulcros y organizados planos de un arquitecto.

Lo fascinante es que en esas regiones aparentemente inservibles conocidas como ‘genoma basura’ se han encontrado genes implicados en el desarrollo del cáncer y, probablemente, en otras enfermedades.

¿Por qué le hemos llamado ‘genoma basura’ entonces?

Con su obra El origen de las especies, Charles Darwin transformó el concepto de especie, demostrando que todos los organismos estaban relacionados y tenían un origen común. Casi un siglo más tarde, James Watson y Francis Crick pusieron cara a la molécula que conecta a todos los seres vivos: el ADN.

Sin embargo, aún tuvo que transcurrir medio siglo para poder secuenciar los más de 3 mil millones de bases que constituyen el genoma humano. Las expectativas eran realmente altas: se esperaba identificar más de 100 000 genes codificantes de proteínas –o lo que es lo mismo, con una función “clara”– que ayudasen a entender la enorme complejidad del ser humano.

Pero, como casi siempre en ciencia, la realidad fue muy distinta. Apenas había 20 000 genes funcionales, poco más que los identificados en una mosca o en un gusano. Simultáneamente, descubrimos que el genoma está plagado de secuencias repetitivas, genes defectuosos, antiguos virus… sin función aparente. De ahí que a esta mitad del genoma se le denomine ‘genoma basura’.

Claro que, en este caso, basura no es sinónimo de inservible. Al igual que en una excavación arqueológica, el análisis de estas secuencias permite identificar restos de lo que una vez fuimos. Así, podemos identificar restos de genes implicados en la formación de huevos (presentes en animales ovíparos) pero que, al ser innecesarios en mamíferos placentarios, han acumulado mutaciones letales. En cierto modo, han quedado “abandonados”, como una ánfora rota en un vertedero.

¿Y por qué hay tantas repeticiones en ese “genoma basura”? Ahí la culpa es de los virus. Con su maquinaria para hacer copias de sí mismos han provocado que pequeñas secuencias de genoma se hayan replicado en el genoma humano cientos o miles de veces. Todo ello ha dado lugar a numerosas secuencias repetidas.

El resultado final es que nuestro genoma se asemeja al plano de un edificio. Solo que es un plano muy peculiar, algo confuso, porque en su versión final han quedado reflejados todos los bocetos anteriores, junto con garabatos y copias de estructuras.

Estas copias, que en el caso del ADN se denominan ‘secuencias repetitivas’, constituyen aproximadamente la mitad del genoma humano. Y, lejos de ser inútiles, contienen elementos esenciales para el funcionamiento de la célula.

Siguiendo la pista del ‘genoma basura’

Los investigadores necesitan averiguar de qué lugar del genoma procede una determinada secuencia. El reto sería equivalente a que nos den una foto aérea de un edificio y localizar el país, la ciudad y la calle a las que pertenece.

La identificación del lugar del que procede una secuencia es relativamente sencilla cuando es una secuencia única. Pero cuando se trata de una secuencia repetitiva, no es sencillo identificar de qué cromosoma proviene. Sucede lo mismo que si tenemos una imagen de un pequeño trozo de desierto: cuesta horrores determinar con exactitud dónde fue tomada dicha foto.

Esta es la razón por la que el genoma basura, este genoma repetitivo que representa casi la mitad de nuestro material genético, aún no se ha podido analizar en detalle en el contexto del cáncer.

Mutaciones del genoma basura implicadas en el desarrollo del cáncer

Con el objeto de explorar la posible presencia de mutaciones en el genoma repetitivo, nuestro grupo desarrolló una herramienta bioinformática denominada ‘Armadillo’. Esta herramienta permite combinar todas las secuencias de un gen repetitivo en una única secuencia y analizar si hay mutaciones en las muestras tumorales ausentes en las células sanas del mismo paciente.

De este modo logramos identificar un gen, denominado ARN nuclear pequeño U2, que tenía mutada la base 28 en decenas de tumores, especialmente hematológicos, –leucemia linfática crónica, varios tipos de linfoma…– así como en cáncer de próstata. Se trata de un gen que, por definición, podría considerarse parte del genoma basura, ya que tenemos múltiples copias idénticas de la misma secuencia. Sin embargo, participa en un proceso fundamental para el funcionamiento de la célula, dirigiendo la maduración de la mayoría de ARNs que son traducidos a proteínas.

Todo esto muestra que, de nuevo como en buena excavación arqueológica, aunque hayamos encontrado ya una importante y valiosa parte de lo que buscamos, aún quedan grandes cosas por descubrir en el genoma. Sobre todo en las regiones repetitivas, que apenas hemos empezado a explorar.

Será más fácil ahora que al fin se ha completado la secuencia del genoma humano usando nuevas técnicas de secuenciación que permiten generar secuencias más largas. Gracias a esta tecnología hemos rellenado muchos de los huecos que aún quedaban en el borrador del que disponíamos desde hace 20 años.

La aplicación de estas mismas tecnologías para la secuenciación de genomas del cáncer permitirá explorar estas regiones repetitivas que hasta ahora han permanecido inaccesibles a la investigación oncológica.The Conversation

Xose Antón Suárez Puente, Catedrático de Bioquímica y Biología Molecular, Universidad de Oviedo y Pablo Bousquets Muñoz, Investigador predoctoral, Universidad de Oviedo

Este artículo fue publicado originalmente en The Conversation. Lea el original.