An organization in development - Evaluation of Dutch support to capacity development

Los distintos algoritmos utilizados para encontrar clústeres en las poblaciones son útiles para modelar realidades complejas, que muchas veces distan de seguir modelos poblacionales. Los clústeres genéticos pueden ser estructuras significativas y reflejar procesos biológicos de interés, aun así, continúan siendo modelos.

Una cuestión de mayor interés sería averiguar cuántos clústeres son útiles para describir a una población. Se debe entender que los clústeres son herramientas para resumir y comprender de manera más adecuada a la población. Teniendo en cuenta este concepto, no existiría un número “real” de subpoblaciones, pero algunos valores de K son mejores que otros y captan la información genética de manera más eficiente (Jombart y Collins, 2015).

En el presente trabajo, los materiales de diferentes orígenes geográficos se ubicaron mezclados dentro de los clústeres definidos por el set de marcadores con bajo DL. El patrón de separación de los clústeres estaría asociado a intercambios de germoplasma, cruzamientos, introducciones directas y selección durante la historia de mejoramiento, tanto en nuestro país como en el exterior. Este comportamiento coincide con lo hallado recientemente en trigo candeal por Mengistu et al. (2016) y Liu et al. (2017), en el cual las accesiones de distintos orígenes geográficos se agruparon en distintas proporciones en los clústeres encontrados. En el trabajo de Liu et al. (2017), el número de clústeres hallados fue menor que el número de orígenes geográficos (3 clústeres vs. 8 orígenes geográficos); similar a lo ocurrido en la presente tesis.

Los diferentes enfoques utilizados para analizar la estructura de la colección del germoplasma del CERZOS (PCoA, STRUCTURE y DAPC) proporcionaron información complementaria. El software STRUCTURE permitió detectar clústeres de diversidad globales. Sin embargo, el número más probable de clústeres en base al criterio ΔK de Evanno et al. (2005) fue K=2. En muchos casos, el método Evanno es capaz de detectar sólo el nivel más elevado de estructura de los genotipos, ya que se

enfoca exclusivamente en el cambio de la pendiente. De acuerdo con algunos autores, esto podría provocar que el ΔK sea máximo de forma artificial en K=2 (Campos et al., 2016; https://groups.google.com/forum/#!forum/structure-software). El valor K=2 ha sido reportado frecuentemente al analizar colecciones de germoplasma (Vigoroux et al., 2008; Cubry et al., 2013; Liang et al., 2015; Novoselović et al., 2016; Baytar et al., 2017; Sharma et al., 2017; Pasam et al., 2017).

Además, se debe tener en cuenta que el modelo matemático del software STRUCTURE fue diseñado para agrupar individuos en subpoblaciones dentro del equilibrio de Hardy-Weinberg (Kalinowski, 2011), y no siempre explicaría lo que ocurre en poblaciones sujetas a las distintas fuerzas que afectan a las poblaciones.

Los resultados obtenidos a través del STRUCTURE fueron considerados como insuficientes al momento de analizar la estructura poblacional de la colección de CERZOS, ya que gran parte de los genotipos no pudieron ser asignados claramente a alguno de los dos clústeres (probabilidad>0,80) y, además, el número de clústeres detectados (K=2) no se ajustaría a la colección. Los clústeres hallados evidenciaron las mayores disimilitudes (clúster 1 relacionado a CIMMYT y clúster 2 relacionado a genotipos italianos y Taganrog), pero el software no pudo encontrar un mayor número de clústeres con menores niveles estructurales.

El DAPC fue una alternativa interesante al software STRUCTURE, ya que no requiere que las poblaciones estén en equilibrio de Hardy-Weinberg y puede procesar gran cantidad de datos en poco tiempo. Sin embargo, como sucede con otros métodos multivariados, la reducción de información genética a distancias entre individuos o entre poblaciones podría representar una pérdida de información.

En el presente trabajo, el DAPC logró proporcionar una descripción eficiente de los clústeres genéticos utilizando unas pocas variables sintéticas. Los clústeres hallados (K=4), fueron coherentes con la información de pedigree y se ajustarían mejor a la diversidad genética conocida a priori de la colección.

La identificación de clústeres subpoblacionales mediante DAPC ha sido utilizado en gran cantidad de publicaciones científicas de genética vegetal (Macharia, 2013; Qui et al., 2015; Rosyara et al., 2016; Campoy et al., 2016; González et al., 2016; Monteiro et al., 2016; Zaidi et al., 2016; Berdugo-Cely et al., 2017; N’Diaye et al., 2017; Stetter et al., 2017; Wang et al., 2017) en conjunto con el método Bayesiano del

software STRUCTURE. Es frecuente que el número de clústeres elegido cambie según la metodología utilizada para definir la estructura poblacional (DAPC o método Bayesiano implementado en STRUCTURE) (Macharia, 2013; Qui et al., 2015; Rosyara et al., 2016; Campoy et al., 2016).

Por otra parte, la metodología DAPC provee probabilidades de pertenencia de cada individuo para los distintos grupos, basándose en las funciones discriminantes retenidas. Estas probabilidades son diferentes de los coeficientes arrojados por softwares como STRUCTURE; de todas maneras, pueden ser interpretados como la cercanía de los individuos a los diferentes clústeres. El valor de la probabilidad también proporciona información de cuán bien definidos están los clústeres (Jombart y Collins, 2015). En el trabajo realizado por N’Diaye et al. (2017) en trigo candeal, se utilizaron los valores de probabilidad obtenidos por DAPC para la construcción de la matriz Q necesaria para el MA.

3.7. Estructura poblacional y su impacto en el fenotipo

Se pudo explorar la asociación entre la estructura de la colección de CERZOS (n=170) encontrada mediante DAPC y los caracteres fenotípicos estudiados en esta tesis medidos en la campaña 2014 (170 genotipos). De esta manera, la estructura de la población fue asociada a diferencias en el rendimiento, días a espigazón, peso de mil granos, y contenido de proteína (Tablas AT11, Apéndice; 11 y 12). No fue posible detectar diferencias entre los diferentes clústeres para la fuerza de gluten, posiblemente a que cada clúster fue integrado por genotipos de rangos amplios de calidad industrial (Tablas AT11, Apéndice). Probablemente, los marcadores que pudiesen separar clústeres de calidad no fueron utilizados (filtrados por alto DL).

Tabla 11. Estimadores de las medias de los caracteres fenotípicos medidos, según Clúster proveniente del DAPC, campaña 2014. Rendimiento (RTO, Kg ha-1_{), días a espigazón (dEsp,}

días), peso de mil granos (TKW, g), contenido de proteína (PROT, %) y fuerza de gluten (SDS, mm); campaña 2014.

RTO14

dEsp14

TKW14

PROT14

SDS14

Clúster 1

3385

78

34.3

12.6

65 Clúster 2

2787

75

35.8

13.0

62 Clúster 3

3503

72

36.0

12.4

64 Clúster 4

3794

72

32.3

12.0

65

Tabla 12. Diferencias en los estimadores de las medias entre los clústeres hallados mediante DAPC. Rendimiento (RTO, Kg ha-1_{), días a espigazón (dEsp, días), peso de mil granos (TKW,}

g.), contenido de proteína (PROT, %) y fuerza de gluten (SDS, mm), campaña 2014.

RTO14 dEsp14 TKW14 PROT14 SDS14

Clúster 1 Clúster 2 ** ** ns ** ns " Clúster 3 ns ** * ns ns " Clúster 4 ** ** * ** ns Clúster 2 Clúster 3 ** ** ns ** ns " Clúster 4 ** ** ** ** ns Clúster 3 Clúster 4 ** ns ** ** ns

Los cultivares de los clústeres 3 y 4 mostraron ciclos vegetativos cortos (72 días a espigazón). Como fue mencionado previamente, los clústeres 3 y 4 estuvieron integrados por materiales provenientes de CIMMYT, sus cruzamientos y selección. Gran parte del germoplasma desarrollado en este centro internacional de mejoramiento está destinado a ser cultivado en regiones cálidas, con o sin estación seca, en donde, normalmente se prefieren ciclos vegetativos cortos para alcanzar la seguridad alimentaria (http://www.cimmyt.org/annual-reports/; http://www.cimmyt.org/food-security/). En nuestro país, este tipo de cultivares logran mejor desempeño agronómico en siembras tardías (a partir de mediados de julio para los ambientes del sur de la provincia de Bs. As.).

Por otra parte, los genotipos del primer clúster mostraron la mayor longitud de ciclo vegetativo (78 días en promedio), en coincidencia con sitios geográficos de origen y selección en donde se prefieren los ciclos vegetativos largos e intermedios, con buena tolerancia a frío; por ejemplo, Francia, EEUU y el sur de la provincia de Buenos Aires. La obtención de variedades y líneas elite de ciclos vegetativos intermedios a largos ha sido uno de los principales objetivos del programa público de mejoramiento nacional de los últimos años (CEI Barrow e INTA Bordenave) (Ing. Carlos Jensen, comunicación personal). Se puede mencionar a Bonaerense INTA Cariló (7), VF 0113 (22), VF 0163 (23), VF 0167 (26), CBW 0105 (33), CBW 0112 (34), CBW 0120 (35), CBW 0153 (37), CBW 0230 (41), CBW 0101 (54), CBW 05082 (133), CBW 05024 (160), CBW 05072 (161), CBW 05080 =Bonaerense INTA Quillén (162) y CBW 05081 (163), como los principales cultivares en donde se ha buscado una mayor duración del ciclo vegetativo, ubicados en el clúster 1.

El segundo clúster presentó una situación intermedia para la variable dEsp (75 días).

Fue posible encontrar diferencias en el rendimiento (Kg ha-1_{) entre los}

clústeres. El clúster 4 presento en promedio, los mayores valores, seguido del 3, 1 y finalmente el 2. Dichas diferencias podrían ser atribuibles, en parte, a las fechas de siembra de los ensayos en el año 2014, favorables a los ciclos vegetativos cortos (fin de julio y principios de agosto; Tabla AT2, Apéndice). Esta justificación es pertinente a los clústeres 4, 3 y 1. La fecha de siembra óptima recomendable para alcanzar los mayores rendimientos para gran parte de los genotipos que integran el clúster 1 por su duración de ciclo vegetativo sería desde fines de junio a mediados de julio. A pesar de ello, no se hallaron diferencias de rendimiento entre los clústeres 1 y 3, posiblemente por el buen potencial de rendimiento de los genotipos, aún en siembras tardías.

Las diferencias de RTO entre los clústeres 3 y 4 (igual ciclo vegetativo en promedio) podrían deberse a las características climáticas particulares de 2014, en donde se presentaron precipitaciones y temperaturas muy por encima del registro histórico en todas las localidades (Tabla AT1, Apéndice). Esta situación meteorológica pareció ser favorable a los genotipos que integraron el cuarto clúster.

La explicación del menor rendimiento de las accesiones ubicadas en el segundo clúster podría deberse a que son materiales en su mayoría “antiguos”, en la actualidad superados por el mejoramiento genético y, en muchos casos, sin genes de enanismo.

Los valores de proteína entre clústeres se ubicaron en un ranking inverso al del rendimiento, es decir, a mayores rendimientos, menores valores de contenido de proteína en grano (clúster 2, 1, 3 y 4).

Como fue mencionado previamente, los valores de TKW fueron bajos para lo esperado en trigo candeal, explicado en parte, por las características del 2014, en donde las condiciones favorables para alcanzar buenos rendimientos provocaron un mayor número potencial de granos, con el consecuente descenso en su peso unitario. Además, las temperaturas superiores a la media histórica pudieron provocar un menor período de llenado de granos, ocasionando una caída adicional en el TKW. No obstante, es clara la diferencia entre el TKW del clúster 4 y el resto de los clústeres, atribuible a los mayores rendimientos y a que los materiales provenientes de CIMMYT,

con un elevado número de espigas m-2_{, y que históricamente poseen menores TKW}

que materiales de otros orígenes cuando se los cultiva en el sur bonaerense (Ing. Carlos Jensen, comunicación personal). Es posible que la fecha de siembra de los ensayos en 2014 haya provocado reducción en el TKW de los materiales del clúster 1.

El análisis entre caracteres fenotípicos y los clústeres encontrados mediante DAPC, aunque exploratorio, podría ser de utilidad para describir, a grandes rasgos, las características agronómicas de la colección de CERZOS. Además, se debe tener en cuenta que la confección de los clústeres fue realizada a partir de un set de 1000 marcadores en bajo DL.

In document Evaluation of Dutch support to capacity development (Page 106-118)