Adiós a la primacía de los genes

El proyecto Encode señala que los genes son sólo una pequeña parte de la información útil en el genoma
Por Mónica G. Salomone 28 de junio de 2007

Siempre se dijo que el genoma humano contenía toda la información para «construir» una persona, sólo había que saber descifrarla. Y cuando en 2003 se terminó de secuenciar el genoma humano parecía que lo más difícil de ese trabajo de descodificación ya estaba superado. Pero nada es lo que parece. El código que protege la información encriptada en el genoma está aún lejos de ser roto. Encode, un macroproyecto para atacar a fondo el análisis de sólo un 1% del genoma y en el que han participado 35 grupos de investigación de 80 instituciones en todo el mundo, acaba de desmontar algunas de las creencias más establecidas.

«El genoma humano es un almacén de información elegante pero críptico». Así comienza el artículo que el consorcio Encode publicaba en Nature el pasado 14 de junio, tras cuatro años de trabajo coordinados por el National Human Genome Research Institute (NHGRI) y el Laboratorio Europeo de Biología Molecular (EMBL). La magnitud tanto del trabajo como de los resultados obtenidos se refleja en el hecho de que, contemporáneamente con el artículo de Nature, Encode ha publicado 28 trabajos más detallados en Genome Research.

Encode, un acrónimo que hace referencia a Enciclopedia de elementos de ADN, se ha concentrado en el análisis de 44 regiones del genoma, que cubren en total un 1% del total. De estas regiones, 30 han sido seleccionadas al azar y 14 se corresponden con genes o grupos de genes ya identificados y relacionados con enfermedades o con función conocida -por ejemplo los genes hox, que determinan el patrón anatómico general del organismo en los vertebrados. Las regiones estudiadas constituyen unos 30 millones de pares de bases. Las pares de bases vienen a ser las letras del genoma, de las que hay en total unos 3.000 millones.

Nueva perspectiva

En Encode, los investigadores han trabajado con unos 200 paquetes de datos generados por técnicas de alto rendimiento y el resultado, explica Ewan Birney, miembro del EMBL y líder de Encode, es que «ahora tenemos una idea muy buena de lo que podría estar haciendo el 1% del genoma. «Nuestros resultados nos proporcionan una nueva perspectiva acerca de casi todo, desde la transcripción del ADN a la evolución de los mamíferos». Y he aquí la primera sorpresa que proporciona Encode: durante años se ha creído que las únicas unidades funcionales del genoma, lo que en realidad contenía información (las palabras escritas con las pares de bases) eran los genes.

Una maquinaria biológica lee los genes del ADN, los traduce (transcribe) en proteínas y suelta éstas en la célula, listas para llevar a cabo su función correspondiente. Y como hay relativamente pocos genes en todo el genoma humano, unos 22.000, siempre se dijo que el resto era ADN chatarra, tal vez el resultado de millones de años de evolución sin tirar nada a la basura, una especie de trastero biológico. Pero no. Lo que ocurría es que no se disponía de las técnicas adecuadas, muy sofisticadas, para leer realmente el genoma. Con Encode se ha echado la casa por la ventana en lo que a tecnología se refiere.

Y se ha visto que los genes son sólo una pequeña parte de la información útil en el genoma. Nada de basura acumulada en el trastero: en el genoma casi todo debe tener una función. Al menos eso sugiere el hecho de que, al contrario de lo que se pensaba, la maquinaria transcriptora no se concentre sólo en los genes: casi toda la molécula se lee, incluso muchas secuencias que no se traducen en proteínas. Además, muchos de los tramos transcritos se superponen, y no hay una única dirección de lectura del ADN.

Hoy se sabe que cada gen puede traducirse en hasta cinco proteínas, muy distintas entre sí

Viene a ser lo que en un comentario en Nature, John M. Greally (Albert Einstein College of Medicine, Nueva York) describe como la pérdida de primacía de los genes: Encode revela que «el genoma es mucho más que un mero vehículo de genes». Para Francis Collins, director del NHGRI, Encode obliga a la comunidad científica a «repensar algunos de los conceptos más sólidos, como qué son y qué hacen los genes y también cómo han evolucionado los elementos funcionales del genoma. Podría haber importantes implicaciones para los esfuerzos por identificar las secuencias de ADN implicadas en muchas enfermedades humanas».

Preguntas sin respuesta

Una de las grandes preguntas, automática tras el hallazgo de Encode, es: ¿para qué sirve todo ese ADN que se transcribe pero que no da lugar a nuevas proteínas? La respuesta corta es que aún no se sabe. Una de las hipótesis es que el ARN, la molécula en forma de hélice pero de una sola hebra -el ADN tiene una hebra doble- en que se transcribe el ADN, tiene muchas más funciones de las que se creía. Lo aceptado hasta ahora es que la misión del ARN es hacer de templete para trasladar la información del ADN a la máquina de ensamblado de proteínas de la célula: de ADN a ARN y de ahí a una proteína.

Pero en los últimos años se han encontrado más funciones para el ARN, y se cree que esta molécula puede guardar aún más secretos bajo la manga. Si así fuera, tal vez en esas otras funciones aún ocultas del ARN esté la utilidad del ADN que no se traduce en proteínas pero que sí se transcribe. Estas múltiples funciones del ADN podrían tener que ver con otro de los dogmas que ha saltado por los aires tras un análisis detallado del funcionamiento del genoma. Si antes la norma aprendida era «un gen, una proteína», (cada gen se traduce en una única proteína, de forma que si se tiene una proteína se sabe automáticamente la secuencia de bases de ADN que ha ordenado su síntesis), hoy se sabe que cada gen puede traducirse en hasta cinco proteínas, muy distintas entre sí. Esto implica añadir otro nivel de complejidad a la codificación de la información en el genoma.

Otro de los resultados de Encode tiene que ver con la evolución. Los investigadores parten del principio de que una secuencia de ADN es importante, cumple una función esencial en el organismo, cuando está presente en el genoma de especies distintas. Significa que la evolución lo ha conservado, o, en otras palabras, que los organismos que sufrieron mutaciones en ese fragmento murieron sin descendencia -y por tanto ese pedazo de ADN está bien como está y cualquier cambio resulta letal-. Hasta ahora siempre se había pensado que los fragmentos conservados se correspondían con proteínas claves para el organismo.

Hipótesis

Y sin embargo, no siempre es así. Los investigadores se encuentran con fragmentos muy conservados que no se traducen a proteínas, y a la inversa, secuencias que sí tienen una funcionalidad clara y que no se conservan. «Alrededor de la mitad de los elementos funcionales en el genoma humano no parecen haber sido sometidos a presión evolutiva», explica el EMBL en una nota informativa. ¿Cómo explicarlo? Una hipótesis es que la evolución se cubre las espaldas con un almacén de elementos funcionales diversos pero neutros, cuya existencia no implica variaciones en la supervivencia o la reproducción. Pero todo está por ver.

De cara al futuro, el gran interrogante que planea ahora sobre la comunidad genómica es cómo trasladar ahora el esfuerzo realizado en Encode al 99% restante del genoma humano. Si un 1% ha llevado cuatro años, ¿cuándo tendremos el resto? Además, es posible que determinados elementos funcionales estén activos sólo durante etapas determinadas del desarrollo, y en tipos celulares concretos. Pero quien crea que los investigadores están desanimados se equivoca. Más bien al contrario: parece ser que «cuanto más difícil, más emoción».

INVESTIGADORES ESPAÑOLES EN ENCODE

Img enc1

De los 300 científicos que han participado en Encode, 14 eran españoles. Roderic Guigó, bioinformático e investigador del Centro de Regulación Genómica, en Barcelona, ha coordinado uno de los cinco grandes grupos de trabajo de Encode, el de transcripción y genes. Guigó ya ha anunciado sin embargo que en la fase siguiente del proyecto ya no podrá tener un papel tan relevante, porque se requieren infraestructuras y equipos de los que no dispone España. Otros nombres españoles son Alfonso Valencia, director del programa de Biología Estructural y Biocomputación del CNIO y director del Instituto Nacional de Bioinformática. Valencia ha coordinado la participación de Biosapiens, una red europea de estudio de las proteínas.

Sigue a Consumer en Instagram, X, Threads, Facebook, Linkedin o Youtube