3. The Problem Domain
3.5. Attention
En este estudio se genotiparon individuos de diferentes poblaciones humanas para todas las inversiones polimórficas. Se usaron tres métodos diferentes. Mediante experimentos de PCR e iPCR se genotiparon 10 individuos de 3 poblaciones procedentes del proyecto
HapMap, en concreto las poblaciones Europea, Africana y Asiática. También se genotiparon los 90 individuos pertenecientes a la población Europea provenientes del mismo proyecto. Los resultados de la genotipación nos permitieron tener una frecuencia muy aproximada de las inversiones polimórficas a nivel global y más fiable para la población Europea. En segundo lugar, para las inversiones con puntos de rotura sencillos se genotiparon bioinformáticamente individuos de 14 poblaciones humanas procedentes del proyecto de los 1000 Genomas [1000 Genomes Project Consortium. 2012], mediante el mapeo de reads provenientes de la secuenciación sobre los puntos de rotura de las inversiones. Además, a partir de la determinación de SNPs marcador para las inversiones polimórficas se estimaron sus frecuencias en esas mismas 14 poblaciones. Estos dos últimos métodos de genotipación permitieron obtener frecuencias de poblaciones humanas en todos los continentes y pudimos analizar de esta manera su distribución mundial, aunque sólo se pueden aplicar a una parte de las inversiones.
El resultado de la genotipación nos mostró diferentes frecuencias en las distintas poblaciones para las inversiones polimórficas, y en algunos casos una variación visible que se hace más grande cuando agrupamos las poblaciones por continentes. Para analizar estas diferencias y calcular qué parte de esta variación se debe a cómo las inversiones diferencian las poblaciones, se usó el índice de fijación o Fst y se calculó su significación mediante el p-valor. Como resultado obtuvimos valores de Fst significativos para 9 de las 10 inversiones polimórficas con frecuencias para las 14 poblaciones. Los valores de Fst mayores que 0 indican cierto grado de diferenciación interpoblacional, siendo el valor 1 el aislamiento total. En el proyecto de los 1000 Genomas se estimó la diferenciación basal entre poblaciones humanas, por ejemplo entre población Europea y Africana en valores de Fst de 0.07, de 0.08 entre población Africana y Asiática, y 0.05 entre población Asiática y Europea[Durbin et al. 2010]. A partir de estas estimas, se considera el valor de Fst aproximado de 0.1 como la diferenciación genética basal de las poblaciones y por eso lo usamos para distinguir las inversiones que muestran una diferenciación mayor de la esperada entre las poblaciones, que son las 5 que tienen valores de Fst superiores a 0.1. Consecuentemente estas inversiones son candidatas a estar implicadas en procesos adaptativos [Kirckpatrick et al. 2010].
No obstante la determinación de si realmente tienen efectos adaptativos en las poblaciones y si su posible implicación adaptativa se produce a través de los efectos de posición de sus puntos de rotura o bien a través de la inhibición de la recombinación en la región invertida en individuos heterocigotos no es trivial. En la literatura no hay prácticamente evidencias de fenotipos asociados a inversiones polimórficas causados por disrupción de genes por los puntos de rotura. En este aspecto, en el conjunto de inversiones analizado no se encuentran puntos de rotura con efectos de posición drásticos que expliquen la posible selección de las inversiones, pero sí posibles efectos más sutiles, ya que algunas se encuentran en intrones, cerca de algún gen, o invierten genes duplicados o parte de ellos, y podrían tener efectos sobre el splicing o la regulación
génica. Además, algunas inversiones que diferencian poblaciones humanas tienen tamaños muy pequeños del orden de 100 pb, de manera que es difícil pensar en que hayan capturado combinaciones de alelos favorables en una región tan pequeña. Por eso no podemos descartar que las inversiones puedan ser seleccionadas por los efectos de posición de sus puntos de rotura. Evidentemente no podemos hablar de selección porque no hemos realizado tests para demostrar su implicación. En cambio, sí que podemos decir que de haber selección no esperamos que sea fuerte, ya que no encontramos inversiones con efectos de posición drásticos como por ejemplo que rompan un exón o separen un gen en dos partes. En nuestro estudio hemos realizado el test de Hardy-Weingberg para todas las inversiones en la población Europea y todas las inversiones lo cumplen. Esto sólo nos permite corroborar que no se esperan efectos selectivos fuertes, pero el test de Hardy-Weingberg tiene poco poder para demostrar la ausencia de selección. Por eso no podemos descartar que se dé selección suave sobre las inversiones. A diferencia de especies como D. melanogaster, en humanos las inversiones polimórficas analizadas no forman clinas que evidencien su implicación en la adaptación local. Nuestros resultados nos muestran que algunas inversiones pueden estar detrás de la diferenciación entre poblaciones, y algunas son candidatas a haberse propagado gracias a la actuación de la selección natural, cosa que discutiremos en los siguientes apartados.
En este apartado tratamos de explicar cuál es la fuerza evolutiva que actuó o está actuando en la propagación de cada una de las inversiones polimórficas en las poblaciones humanas, a través de las frecuencias del alelo invertido, la estructuración de la población, el alelo ancestral y la especulación de los posibles efectos funcionales de las inversiones. La gran limitación es el no contar con tests de selección. Por lo tanto, no podemos sacar conclusiones sobre la implicación adaptativa de estas inversiones; pero sí que podemos analizar los casos interesantes, es decir, las inversiones que por su distribución poblacional pueden diferenciar a las poblaciones, e intentar determinar si la selección natural puede tener un papel en su distribución.
El análisis de la distribución poblacional se ha realizado sobre las frecuencias alélicas calculadas a partir de la genotipación bioinformática y de SNPs marcador, y para algunas inversiones se han comparado con las frecuencias obtenidas mediante genotipación experimental en 7 poblaciones de todo el mundo [S. Villatoro y M. Cáceres, resultados no publicados]. Las frecuencias alélicas son muy similares para todas las inversiones en las 6 poblaciones que son comunes a ambos análisis (CEU, TSI, CHB, JPT, LWK y YRI) y no varían por encima del 10%, con la excepción de la inversión HsInv0068, para la que no disponemos de frecuencia del alelo invertido en la población originaria de Kenya mientras que si se ha calculado en el estudio de Villatoro y colaboradores además de mostrar una variación mayor del 10% en población Europea; y las inversiones HsInv0045 y HsInv0058 que tienen una variación de más del 10% en población LWK. Hay que tener en cuenta que el número de individuos genotipados es diferente, lo cual explica que las frecuencias no sean exactamente iguales. Aun así los resultados muy similares obtenidos
en la comparación de ambas aproximaciones a sus distribuciones poblacionales reales, da fiabilidad a los datos obtenidos de manera no experimental.
En primer lugar, en base al índice Fst y las frecuencias poblacionales del alelo invertido (diferente al del genoma de Referencia) podemos diferenciar tres tipos de inversiones: las que no muestran diferencias aparentes en la frecuencia del alelo invertido en las poblaciones (una diferencia menor o igual al 10% en la frecuencia del alelo invertido entre cada continente y la frecuencia global) y no provocan una estructuración de la población por encima de la estructura basal, que como hemos visto anteriormente situamos en valores de Fst iguales o inferiores a 0.10; las inversiones que no provocan una estructuración de la población por encima de la estructura basal y que tienen diferencias en la frecuencias del alelo invertido entre las poblaciones (una diferencia superior al 10% en la frecuencia del alelo invertido entre cada continente y la frecuencia global); y por último las inversiones que provocan una estructuración por encima del valor basal y tienen diferencias en las frecuencias del alelo invertido entre poblaciones y continentes.
Las frecuencias del alelo invertido similares entre poblaciones y los valores de Fst iguales o inferiores a 0.1 que encontramos en el primer grupo de inversiones, nos sugieren a priori que posiblemente se han propagado en las poblaciones humanas de manera neutra, por lo que la fuerza evolutiva responsable sería la deriva genética, y sería la migración de la población humana del continente Africano hacia el resto de continentes lo que ha determinado su distribución actual, a través de los cambios de tamaño de la población. No obstante, al no haber realizado test de selección, no podemos descartar que estas inversiones hayan sido seleccionadas. Podría darse por ejemplo selección equilibradora que mantuviese el polimorfismo en las poblaciones y las frecuencias del alelo invertido similares. En este grupo se encuentran las inversiones HsInv0031, HsInv0040 y HsInv0058.
En cuanto a los posibles efectos funcionales e implicación en enfermedades de este grupo de inversiones, hay que destacar que no interaccionan directamente con genes, es decir, sus puntos de rotura no están localizados en ningún gen. Aun así, las inversiones HsInv0031 y HsInv0058 están localizadas cerca de genes por lo que pueden tener efectos reguladores sobre ellos. En concreto, la inversión HsInv0031 se encuentra 5665 pb aguas abajo del gen no codificante de proteínas LOC400548 de función desconocida, por lo que debido a la distancia y posición relativa de ambos parece difícil explicar los posibles efectos de la inversión sobre la regulación del gen. La inversión HsInv0058 se encuentra 6041 pb aguas abajo del gen MUC22 y 11131 pb aguas arriba del gen HCG22. Al igual que la inversión HsInv0031, la posición respecto al gen MUC22 hace que sea más difícil pensar en un efecto sobre su regulación. Sin embargo a pesar de que la distancia es mayor, es posible que pueda afectar a la regulación del gen HCG22 porque se encuentra relativamente más cerca del punto de inicio de la transcripción. El gen MUC22 codifica