THE WAKE OF NUFFIELD
SECTION C: YOUR PLANS FOR THE FUTURE
En apartados anteriores hemos visto como la secuencia del genoma humano permitió diseñar sondas por todo el genoma y esto fue clave para el desarrollo de los microarrays o micro matrices, que permite comparar dos genomas en cuanto a su variación de CNVs. Estas técnicas provocaría una revolución en cuanto a la detección de variantes estructurales submicroscópicas y marcaría el paso de las técnicas dirigidas a las técnicas genómicas [Sharp et al 2006]. Estas técnicas se pueden dividir en la hibridación genómica comparada en matriz, aCGH, y las matrices de SNPs. En la hibridación genómica comparada se marcan fluorescentemente un genoma prueba y un genoma de referencia, con marcadores de distinto color. Entonces se les bloquean los elementos repetitivos para que no puedan hibridar y se hibridan ambos genomas completos con una matriz de fragmentos de ADN fijada en un sustrato vidrioso, que representan las regiones a testar y que pueden corresponder a ventanas de todo el genoma. Las diferencias en la señal fluorescente indican los cambios en el número de copias entre ambos genomas (Figura 1.7).
Figura 1.7: Esquema de la técnica de hibridación genómica comparada. El ADN de referencia y el de prueba están marcados con diferentes marcadores, Cy5 y Cy3 respectivamente. Se hibrídan a las matrices de ADN genómico después de bloquear los elementos repetitivos con ADN COT-1. Después se determinan las diferencias en la señal fluorescente para detectar los
CNVs. Figura modificada de Feuk et al. 2006.
Una pérdida de ADN en la muestra de referencia y una ganancia en la muestra de prueba producen una misma señal fluorescente, de manera que es necesario tener un genoma de Referencia muy bien caracterizado para poder interpretar los datos del experimento [Alkan et al. 2011]. Gracias al proyecto de secuenciación del genoma humano se pudo generar una librería de fragmentos clonados, BACs de localización conocida que se
usaron en los primeros microarrays. Los CNVs que se podían detectar con estas matrices de BACs tenían un tamaño mayor de 100 Kb debido a la baja resolución y densidad de sondas [Iafrate et al. 2004, Sebat et al. 2004]. El uso de otros tipos de sondas como ADN complementarios clonados o productos de PCR de cadena única, permitió analizar los CNVs con mayor resolución y se usaron especialmente para ver efectos en exones [Sharp et al. 2006]. Finalmente el uso de oligonucleótidos, es decir, de sondas sintetizadas de 25 a 75 pb de longitud, marcó la diferencia en cuanto a mayor resolución de los microarrays. Su síntesis es rápida y da muy buenos resultados en cuanto a uniformidad y densidad de las sondas en la matriz [Sharp et al. 2006], por lo que se usan actualmente microarrays con alrededor de 2 millones de sondas de 25 pb y con 1 millón de oligonucleótidos de 75 pb. De esta manera un CNV está representado por entre 3 y 10 sondas y su localización es mucho más precisa evitándose la variación entre muestras [Alkan et al. 2011].
En el paso del uso de BACs a oligonucleótidos apareció una variación de la técnica llamada ROMA, análisis de microarray de oligonucleótidos representacionales [Sebat et al. 2004]. Se basa en reducir la complejidad del genoma para aumentar la señal obtenida respecto al ruido de fondo. Esto se consigue cortando el ADN con enzimas de restricción que tengan dianas repartidas uniformemente por el genoma y ligando los fragmentos a adaptadores. Estos adaptadores tienen cebadores para realizar una amplificación por PCR. Se usan las condiciones de la PCR para amplificar sólo los fragmentos de un determinado tamaño que serán los que se hibrídan a la matriz de sondas [Feuk et al. 2006]. Esta variante se desarrolló debido al alto coste de generar arrays de oligonucleótidos de alta densidad que cubrieran todo el genoma. Además del ROMA, se han aprovechado arrays alternativos que fueron diseñados para genotipar SNPs pero que se usan para detectar CNVs a baja resolución [Sharp et al. 2006]. La diferencia de los microarrays de SNPs respecto a aCGH es que la hibridación se realiza con una única muestra y se computan las intensidades de hibridación de varias muestras para detectar las ganancias o pérdidas de ADN, es decir, se calculan intensidades medias a partir de muestras control con las que se comparan las obtenidas de las muestras prueba. Las desviaciones de la media indican el cambio en el número de copias. Además, estos arrays dan información sobre genotipos, pudiéndose detectar por ejemplo la pérdida de heterocigosidad, falta de variación nucleotídica, y esto es una evidencia de una deleción en la zona o bien una disomía uniparental [Feuk et al. 2006].
Los microarrays son útiles para detectar CNVs a lo largo del genoma, pero tienen limitaciones, como su resolución insuficiente para la localización con precisión nucleotídica, o el coste de los microarrays de mayor resolución. Por estos motivos, se requiere un análisis más detallado de las secuencias. Las técnicas clásicas como la PCR cuantitativa tienen la solución pero su aplicación es muy dirigida, por lo que se necesitan técnicas que permitan genotipar variantes estructurales a un coste asequible y de manera múltiple. Con ese propósito se desarrollaron dos técnicas basadas en la hibridación múltiple de sondas específicas de secuencias diana: la hibridación y amplificación de
múltiples sondas, MAPH, [Armour et al. 2000] y la amplificación múltiple de sondas dependiente de ligación, MLPA, [Schouten et al. 2002]. Ambas utilizan la PCR para amplificar las sondas marcadas fluorescentemente, y la diferencia con la PCR cuantitativa reside en que en estas técnicas los cebadores son universales y se cuantifican hasta 40 regiones diana [Sellner et al. 2004].
En la técnica de MAPH el ADN se fija en una membrana y se hibrida con las sondas específicas de las secuencias a detectar [Armour et al. 2000]. Estas sondas se generan clonando las secuencias diana y amplificando con cebadores de la secuencia diana hacia el vector, de manera que todas tienen la misma secuencia flanqueante. Se lava la membrana para eliminar las sondas que no han hibridado, luego se separan las sondas específicas de la membrana y se amplifican con cebadores universales. Finalmente se comparan las intensidades de las bandas o la altura de los picos dependiendo de si se separan por electroforesis normal o capilar. La comparación con muestras control permiten detectar deleciones y duplicaciones [Sellner et al. 2004]. En el MLPA, el ADN genómico se hibrida con las sondas en solución que tienen dos partes separadas (Figura 1.8). Una parte de unos 20-30 nucleótidos es específica de la secuencia diana y contiene una secuencia de unión de cebador universal en el otro extremo. La otra mitad tiene una secuencia específica de la región adyacente de la secuencia diana de unos 25-43 nucleótidos y un sitio de unión de cebador universal en el otro, con la diferencia que incluye un fragmento de tamaño variable, de entre 19-370 nucleótidos, que genera las diferencias entre sondas para separarlas electroforéticamente [Schouten et al. 2002].
Figura 1.8: Esquema de la técnica de MLPA. De arriba a abajo y de izquierda a derecha se muestran los distintos pasos de la técnica, que incluyen la hibridación de las diferentes partes de las sondas, la ligación de éstas, la desnaturalización que permite que se separen del ADN genómico, su amplificación por PCR y su análisis. Figura modificada a partir de Sellner et al. 2004.
Las partes específicas de diana de ambas partes de la sonda se unen a las secuencias adyacentes a la región a analizar y entonces se unen por ligación. Se genera una sonda flanqueada por sitios de unión de cebadores universales, que puede ser amplificada por PCR mientras que las sondas que no han hibridado no pueden ser amplificadas, y por eso no se necesitan lavados para eliminarlas. La cantidad de sonda ligada es proporcional al CNV diana, y las alturas de los picos que se generan en la electroforesis capilar indican las deleciones o duplicaciones [Sellner et al. 2004].
Recientemente se están desarrollando otras técnicas que se basan en la detección de señales visuales y se denominan técnicas de análisis de una sola molécula de ADN. Persiguen la visualización de fragmentos de ADN a gran escala, donde estos fragmentos suelen estar estirados para poder observar su estructura [Alkan et al. 2011]. La técnica más desarrollada en este campo es el mapeo óptico [Teague et al. 2010]. Se basa en los mapas de restricción tradicionales pero realizados sobre ADN inmovilizado, de manera que se pueden identificar los tamaños de los productos de restricción y los cambios en su orden al compararlos con los patrones del genoma de Referencia digerido in silico, es decir, computacionalmente [Alkan et al. 2011]. A diferencia de los microarrays esta técnica permite detectar variantes balanceadas como inversiones y translocaciones. Se alargan y orientan las moléculas de ADN que se unen a una superficie de vidrio por interacción electrostática. Una vez fijado, el ADN se incuba con una enzima de restricción, luego se tiñe y es revelado por un microscopio de fluorescencia iluminado por un láser de iones de argón que está acoplado a una computadora [Teague et al. 2010]. Una cámara capta las imágenes en el momento que se ilumina la preparación. Todo este proceso es automático y permite analizar entre 50000 y 100000 moléculas al día, lo que equivale a secuenciar un genoma humano con una cobertura de 50 veces en un mes, usando un sólo microscopio. Esta es una de las ventajas de la técnica junto con la detección de todo tipo de variación estructural, incluidas las inversiones.
Figura 1.9: Comparación de mapas de restricción en la técnica de mapeo óptico. Se usa un mapa de restricción generado in silico con el genoma de Referencia, para comenzar el proceso iterativo de alineamiento de mapas similares por parejas. También inicia el ensamblaje local que genera un mapa consenso a partir de los mapas de una sola molécula de ADN. Después de varias iteraciones, se vuelven a alinear los mapas consenso al mapa de referencia y las diferencias indican variantes estructurales potenciales. Imagen tomada de Teague et al. 2010.
El ordenador almacena las imágenes de las moléculas de ADN digeridas y se comparan con un mapa de fragmentos de restricción de ADN generado in silico a partir del genoma de Referencia (Figura 1.9). Este mapa de referencia se usa para comenzar el proceso iterativo de alineamiento visual de fragmentos por pares, que agrupa juntos los fragmentos similares de una sola molécula; y de ensamblaje local, que genera un mapa óptico consenso a partir de un grupo de fragmentos provenientes de varias moléculas. Después de varias iteraciones, se alinean los mapas consenso generados con el mapa de referencia y se analiza en qué regiones hay diferencias, que son, las potenciales variantes estructurales [Teague et al. 2010].