TELECOM PRIVATIZATION REVENUES AMONG EU MEMBER STATES 1984-
1.8 Discursive institutionalism as a theoretical framework
3.2.2.2.1. Análisis de estructura mediante un método Bayesiano
Dada la influencia de la estructura poblacional en los estudios de asociación, es importante conocerla en el conjunto de accesiones a analizar con el fin de evitar posibles falsas asociaciones positivas causadas por la existencia de una colección estructurada. El software Structure 2.0 (Pritchard et al. 2000a), mediante un algoritmo Bayesiano, trata de agrupar probabilísticamente a un conjunto de individuos en distintas poblaciones. Para ello, utiliza datos genotípicos de marcadores moleculares como pueden ser SSRs, RFLPs y SNPs, asumiendo que se encuentran en equilibrio de ligamiento y de Hardy-Weinberg dentro de estas poblaciones.
De los 25 loci microsatélite que estaban genotipados para las colecciones empleadas para el estudio de los genes VvGAI1 y VvPel, se excluyeron los que se encontraban a una distancia inferior a 16,8 cM de otro (Barnaud et al. 2006), así como los que se encontraban en el mismo cromosoma que el gen en cuestión, con el fin de evitar que estuvieran ligados. Así, para el análisis de estructura genética de la CNGAI, de 127 accesiones, se usaron 21 microsatélites, excluyéndose los loci VVIP60 y ssrZAG29 por encontrarse en el cromosoma 1, al igual que el gen VvGAI1, el locus ssrZAG83, mapeado en el cromosoma 4 a 12,4 cM del locus VVMD32, y el locus ssrZAG112, por encontrarse a 15,2 cM del VVMD24 en el cromosoma 14 (Costantini et al. 2007). Para el análisis de la CNPel, de 96 accesiones, se emplearon 22 microsatélites, excluyéndose los loci VVMD24 y ssrZAG112 por encontrarse en el mismo grupo de ligamiento que el gen VvPel y el ssrZAG83 por el mismo motivo que en el caso anterior.
Se asumió un modelo en el cual las variedades que formaban la colección a estudiar, analizadas con esos loci microsatélite, podían estar agrupadas en un número comprendido entre 1 y 10 poblaciones. Se usó una longitud de carrera de la Cadena de Markov Monte Carlo (MCMC) de 1.500.000 pasos, con 500.000 pasos previos de desmemorización. Estos pasos previos se efectúan antes de empezar a comparar las probabilidades de las tablas alternativas con las de la observada, y son necesarios para que la cadena de Markov comience en una tabla aleatoria. Para cada número de poblaciones (K), se realizaron 10 iteraciones.
vecinos. Junto con el modelo de mezcla, se empleó el modelo de las frecuencias correlacionadas descrito por Falush et al. (2003), que asume que el total de poblaciones representadas en la colección de partida proceden de una hipotética población “ancestral”, a partir de la cual han derivado las demás poblaciones, de modo que las frecuencias alélicas de las diferentes poblaciones pueden presentar cierto parecido entre sí. Este modelo, cuando se emplea un número adecuado de marcadores, permite agrupar con exactitud a individuos procedentes de poblaciones estrechamente relacionadas. El criterio empleado por Pritchard et al. (2000a) para detectar el verdadero número de poblaciones que hay en un conjunto de individuos, se basa en determinar el mayor valor logarítmico de la probabilidad de los datos obtenidos (LK), lo cual puede no proporcionar una estimación correcta del número de poblaciones (K): Evanno et al. (2005) detectaron que, una vez alcanzada la K real, el valor de LK continúa aumentando ligeramente para números mayores de poblaciones, así como también aumenta la varianza entre las diferentes repeticiones para cada K. Por ello, se empleó también la metodología descrita por Evanno et al. (2005) para determinar cuántas poblaciones se encontraban en la colección, de acuerdo a la siguiente ecuación:
)
(
)
(
)
(
K
1 1 n n n n n nLK
SD
LK
LK
LK
LK
+−
−
−
−=
Δ
Una vez detectada la K más probable para cada colección, se eligió aquella simulación que presentó la distribución más probable de genotipos para esa K de entre las 10 iteraciones realizadas. La exactitud de la asignación de individuos a una determinada población depende de diferentes factores (Pritchard et al. 2000a), como el número de individuos que componen la población (afecta a la exactitud de las estimas de las frecuencias alélicas de las poblaciones), el número de loci empleados (afecta a la exactitud con que se estima el grado de mezcla que presenta cada individuo), la proporción de mezcla que presenta cada individuo y la diferencia existente entre las frecuencias alélicas presentes en las distintas poblaciones.
Una vez obtenido el número de poblaciones y qué variedades correspondían a cada una, con el software Arlequin 3.11 (Excoffier et al. 2005), se llevó a cabo unAnálisis Molecular de la Varianza (AMOVA). El programa calcula la varianza entre poblaciones permutando
genotipos individuales entre las mismas. A partir de los componentes de la varianza obtenidos se calcula el índice de fijación (FST).
Además, se llevaron a cabo test exactos de diferenciación entre las poblaciones detectadas con el software Structure, empleando cadenas de Markov con una longitud de 1.000.000 de pasos y 100.000 pasos previos de desmemorización. Se estimó la probabilidad de encontrar resultados con menor o igual probabilidad que el observado, bajo la hipótesis de que los individuos están distribuidos al azar en el conjunto de poblaciones estudiadas.
También se estudió, mediante Arlequín 3.11, el EHW para los diferentes loci en cada colección, siguiendo el procedimiento descrito por Guo y Thompson (1992), usando cadenas de Markov con una longitud de 1.000.000 de pasos y 100.000 pasos previos de desmemorización.
3.2.2.2.2. Análisis de agrupamientos
Con el fin de contrastar los resultados obtenidos mediante el software Structure, se llevó a cabo un análisis de agrupamientos para ambas colecciones.
A partir de las mismas tablas de genotipos empleadas en Structure (una tabla de 127 accesiones genotipadas con 21 loci para VvGAI1 y otra de 96 accesiones genotipadas con 22 loci para el gen VvPel), se construyó una matriz de distancias para cada colección mediante el software Microsat 2 (Minch et al. 1997), empleando el coeficiente 1- proporción de alelos compartidos.
Con la matriz obtenida se generó un dendrograma de agrupamiento utilizando el método UPGMA (Unweighed Pair Group Method Average), que se basa en un algoritmo de asociación secuencial, en el cual las relaciones locales se establecen en orden descendente de similitud y el árbol filogenético se construye paso a paso (Sneath y Sokal 1973). Esta técnica establece agrupamientos basándose en la media aritmética de la similitud entre el individuo que podría pertenecer a un grupo y cada uno de los miembros del grupo, o entre todos los miembros de dos grupos. Para ello se usó el software Neighbor implementado en Phylip 3.67 (Felsenstein 1993).
El árbol obtenido fue visualizado mediante el software Treeview (Page 1996) y representado mediante un cladograma rectangular.