Celera-Whatsagenome
¿Para qué sirve la secuenciación del genoma?
La secuenciación del genoma es importante para su comprensión.
La secuencia del genoma es un atajo valioso ya que ayuda a los científicos a encontrar a los genes más fácil y rápidamente. Una secuencia del genoma contiene algunas pistas acerca de donde están los genes, aunque los científicos recién están aprendiendo a interpretarlas.
Los científicos también esperan que el estudio de la secuencia del genoma los ayude a comprender cómo funciona éste como un todo y cómo los genes trabajan juntos para dirigir el crecimiento, desarrollo y mantenimiento de un organismo entero.
Finalmente, los genes constituyen sólo el 5 por ciento del ADN del genoma, así que el conocimiento de la secuencia del genoma ayudará a que los científicos estudien las partes del genoma por afuera de los genes. Esto incluye los sitios reguladores que controlan como los genes se activan y desactivan, como también el ADN “sin sentido”, así llamado por que todavía no se sabe para que sirve.
¿Cómo se secuencia un genoma?
Un genoma se secuencia en partes. El genoma entero no puede ser secuenciado todo junto por que los métodos disponibles de secuenciación de ADN solo funcionan con fragmentos cortos de ADN.
Entonces, los científicos deben fragmentar el genoma en pedazos pequeños, secuenciar los pedazos y luego reconstruirlos en el orden correcto para llegar a la secuencia de todo el genoma.
Existen dos técnicas para fragmentar al genoma y volver a reconstruirlo. Una estrategia, conocida como la técnica del “clon-por-clon”, involucra primero la fragmentación del genoma en pedazos grandes, llamados clones, de 150.000 pares de bases. Los científicos utilizan las técnicas de mapeo genómico para saber donde pertenecen esos fragmentos en el genoma. Luego vuelven a cortar esos clones en fragmentos más cortos (de 500 pb) y que se superponen para poder secuenciarlos. Finalmente, secuencian los fragmentos y utilizan las partes que se superponen para reconstruir la secuencia de todo el clon.
La otra estrategia, llamada “whole-genome shotgun”, involucra la fragmentación de todo el genoma en pequeños pedazos, la secuenciación de los pedazos y la reconstrucción de ellos en la secuencia de todo el genoma.
Cada una de éstas técnicas tiene ventajas y desventajas. El método clon-por clon es confiable pero lento y el paso del mapeo puede ser un gran consumidor de tiempo. Por otro lado, el otro método es muy rápido pero puede ser extremadamente difícil de reconstruir los pequeños pedazos de toda la secuencia.
La secuenciación del genoma humano ha involucrado una combinación de ambas técnicas.
¿Cómo funciona la secuenciación del ADN?
La secuenciación emplea una técnica llamada electroforesis para separar los fragmentos de ADN que difieren en longitud por una base.
En la electroforesis, el ADN que será secuenciado se coloca en un extremo del gel. Los electrodos se colocan a cada extremo y se aplica una corriente eléctrica. Esto hace que los fragmentos de ADN migren a través del gel de acuerdo con su tamaño. La electroforesis sólo puede separar fragmentos de 500 pares de bases, por eso se debe fragmentar el ADN en pedazos para poder secuenciarlo.
Hasta 1980, las electroforesis eran leídas por una persona. Pero este proceso era lento, tedioso y no muy confiable. Hoy en día, los proyectos a gran escala serían imposibles sin los secuenciadores automáticos que han hecho de la secuenciación un proceso más rápido y confiable. En un año, una persona puede producir una secuencia de 20.000 a 50.000 bases; una máquina puede producir una secuencia de este largo en solo unas horas.
La mayoría de las máquinas de secuenciación automáticas tienen un diseño que se basa en el proceso manual. Para usar la máquina, un técnico coloca el gel en un espacio entre dos vidrios de medio milímetro. Luego de que el gel se endurece, el ADN se siembra en cada una de las 96 calles que corren a lo largo del gel. Al aplicar la corriente eléctrica, los fragmentos de ADN migran de acuerdo a su tamaño y la máquina lee el orden de las bases de ADN y guarda la información en una computadora.
¿Cómo sabe el secuenciador si la base es una A, T, G o C?
Los secuenciadores automáticos no pueden ver al ADN, entonces los científicos deben preparar al ADN para su secuenciación. El ADN está finalmente en una forma que las máquinas pueden leer cuando ha sido fragmentado, copiado, modificado químicamente y unido a fragmentos fluorescentes correspondientes a las cuatro bases diferentes.
Antes de ser secuenciado, un fragmento de ADN se copia muchas veces, luego se divide en cuatro partes para otra fase de copiado. En esta segunda fase de copiado, se agrega una pequeña cantidad de base químicamente modificada a cada parte (o sea, A modificada a una parte, C modificada a otra y así sucesivamente). Cuando una de estas bases modificadas es incorporada en la molécula de ADN, la cadena de bases se frena. El resultado de todo esto es que una parte contendrá solo fragmentos que terminen en A, otra parte fragmentos que terminen en C y así sucesivamente.
Además, en la segunda fase de copiado, se le agrega un tinte fluorescente distinto a cada parte.
Luego se siembra en una misma calle una mezcla de las cuatro partes. Debido a que las moléculas más pequeñas migran más rápido, los fragmentos de ADN se leen en orden creciente de tamaño, cada fragmento con una base más que el anterior.
A medida que los fragmentos migran, un láser detecta los tintes de las moléculas fluorescentes y así se corresponde con la base: A, C, T o G.
¿Qué sucede luego de que las secuencias de ADN salen del secuenciador automático?
Los secuenciadores automáticos llegan a una secuencia “cruda” que contiene agujeros, errores y ambigüedades.
El proceso de limpieza y ordenamiento de la secuencia se llama terminación. Muchas veces este proceso tarda más que la secuenciación.
¿Cómo se ordena un genoma?
Esto se hace mediante un programa de computación. Este programa busca y analiza superposiciones o secuencias idénticas de ADN en diferentes fragmentos. Los fragmentos que contienen superposiciones se encuentran uno al lado del otro en la secuencia final del genoma.
¿Cómo saben los científicos si una secuencia del genoma es correcta?
Cuando un genoma no ha sido secuenciado, no hay nada que les diga a los científicos que esa secuencia es correcta. Además hay muchos errores que pueden ocurrir durante este proceso: cuando se fragmenta el ADN, cuando se copia, cuando se secuencia o cuando se ordena.
Un truco para eliminar los errores es secuenciar el genoma más de una vez.
Además, los programas ordenadores comparan todas las secuencias de los fragmentos que se superponen y generan lo que se conoce como una secuencia “consenso”.
Luego de que una secuencia haya sido ordenada, se puede comparar con los fragmentos de ese genoma que hayan sido secuenciados anteriormente para asegurarse de que sea correcta.
Finalmente, se debe pasar por el proceso de terminación ya que no existe ningún sustituto mecánico para la intuición e inteligencia de un científico con experiencia.
¿Qué hace que la secuenciación del genoma humano sea diferente a la de otros genomas?
El genoma humano es mucho más grande que los genomas que se habían secuenciado anteriormente. La mayoría de los genomas que habían sido secuenciados pertenecían a virus, bacterias u otros organismos simples con pequeños genomas.
Además, el genoma humano contiene un 25 a 50 por ciento de ADN repetitivo, pero las bacterias y virus no contienen mucho ADN repetitivo.
El ADN repetitivo no sólo es difícil de ordenar sino también de secuenciar.