• No results found

CHAPTER FIVE: FINDINGS

5.2 Findings from Head Teacher Interviews

5.2.2 The Second Major Theme: the Condition of the School

La estadística multivariada se utiliza para evaluar simultáneamente tres o más variables medidas en una misma muestra. Un análisis estadístico multivariado puede realizarse a tres niveles: cualitativo (o exploratorio), clasificatorio y cuantitativo.

1.3.1. Análisis multivariado exploratorio.

Las técnicas de exploración de datos se utilizan para descubrir y resaltar la información contenida en una matriz multidimensional de datos. En esta tesis los análisis exploratorios utilizados fueron el análisis de correlación simple de Pearson, el análisis de conglomerados, el análisis de componentes principales y el análisis de procrustes generalizado.

1.3.1.1. Análisis de correlación simple (ACSP).

Se realiza un análisis de correlación simple de Pearson con el fin de obtener una medida de la magnitud de la asociación lineal entre dos variables. Coeficientes de correlación próximos a la unidad y positivos señalan un perfil similar entre las variables afectas; si el coeficiente es negativo y próximo a la unidad señalan perfiles opuestos entre esas variables, indicando que ambas no son independientes, sino que se asocian de algún modo.

1.3.1.2. Análisis de conglomerados (AC).

El AC (del Inglés, Cluster Analysis) es una técnica de agrupamiento de objetos (observaciones o variables). Se usa para agrupar observaciones, variables o entidades de un conjunto de datos en base a sus semejanzas o diferencias. Las variables son las características con respecto a las cuales los objetos varían entre sí y que permiten diferenciarlos.

El propósito del análisis es ubicar a los objetos en grupos o clusters sugeridos por los datos, no definidos “a priori”, tal que los objetos en un grupo dado tiendan a ser semejantes en algún aspecto y los objetos en diferentes grupos tiendan a ser distintos. Generalmente se utiliza para conocer el número de grupos y la estructura latente.

Para medir la asociación entre las entidades a agrupar, es necesario establecer una medida de similitud. En la formación de grupos, la proximidad está dada por algún tipo de distancia. La selección de una medida de distancia apropiada es fundamental en el uso de cualquier técnica de agrupamiento. Esta elección depende de la naturaleza de las variables y del conocimiento del objeto de estudio.

156

En el análisis de conglomerados se utilizan técnicas de clasificación jerárquica y no- jerárquica. Las técnicas de agrupamiento jerárquicas están organizadas de tal manera que un cluster puede estar contenido completamente dentro de otro cluster, pero no está permitido otro tipo de superposición entre ellos. Los objetos similares se agrupan primero y esos grupos iniciales son luego unidos de acuerdo a sus similitudes. Como las diferencias van disminuyendo, al final todos los subgrupos formarán un solo grupo. Los resultados del agrupamiento se muestran en un diagrama de árboles en dos dimensiones (dendrograma), en el que se observan las uniones y/o divisiones que se van realizando en cada nivel del proceso de construcción de conglomerados. Los objetos en un mismo grupo comparten el mayor número permisible de características y los objetos en diferentes grupos tienden a ser distintos (Rebolo et al., 2000).

1.3.1.3. Análisis de componentes principales (ACP).

El ACP permite analizar la interdependencia de variables métricas y encontrar una representación gráfica óptima de la variabilidad de los datos. Esta análisis examina todos los datos en un espacio de menor dimensión que el espacio original de las variables, y trata de encontrar, con mínima perdida de información, un nuevo conjunto de variables (componentes principales) no correlacionadas que expliquen la estructura de la variación entre objetos y variables (Balzarini et al., 2008).

1.3.1.4. Análisis de Procrustes Generalizado (APG).

El APG construye la configuración de consenso de un conjunto de datos mediante la aplicación de transformaciones en un intento de superponerlos. Este análisis representa, por técnicas de coordenadas principales, la estructura y la relación entre objetos a los cuales se les ha medido diferentes variables. Permite ver si diferentes grupos de variables describen a un objeto de la misma forma (Balzarini et al., 2008).

1.3.2. Análisis multivariado clasificatorio: Análisis discriminante (AD).

En un análisis clasificatorio se construyen modelos capaces de pronosticar la pertenencia de un objeto a una categoría sobre la base de las características del objeto. La matriz de datos contiene al menos una variable categórica, que indica la categoría a la que pertenece cada objeto y que constituye la respuesta o variable que se quiere predecir, y una o más variables de escala que describen otras tantas características de los objetos y que se utilizan como variables predictoras (Ramis Ramos & García Álvarez-Coque, 2001).

Dentro de este tipo de análisis se encuentra el análisis discriminante (AD), el cual utiliza un algoritmo que busca combinaciones lineales o cuadráticas de las variables

157

manifiestas que maximizan la varianza entre categorías, a la vez que minimizan las varianzas intra-categorías.

El AD construye una ecuación que contiene una combinación lineal de variables (ponderadas a partir de su importancia relativa para el comportamiento del conjunto) la cual permite luego discriminar en función de un cierto número de parámetros medidos, cuantificando las diferencias entre los distintos grupos e identificando los parámetros más fuertes asociados con dichas diferencias.

El AD utilizado en esta tesis fue el análisis discriminante paso a paso “stepwise” (ADS), el cual sirve para determinar la variable o el conjunto de variables que mejor discriminan entre dos o más grupos que ocurren naturalmente. El procedimiento stepwise

es guiado por los valores respectivos del estadístico F para incluir o eliminar las variables del modelo. El valor F de cada variable indica su significancia estadística en la discriminación entre los grupos, es decir mide hasta qué punto la variable realiza una contribución única para predecir la pertenencia de la muestra a un dado grupo. En general se elegirán las variables cuyos valores de F para inclusión son mayores al valor de corte, y se dejarán afuera aquellas variables del modelo cuya significancia sea menor a la especificada en el F para eliminar.

1.3.3. Análisis multivariado cuantitativo.

En un estudio cuantitativo se construyen modelos de regresión, capaces de predecir unas variables a partir de otras. Entre los métodos incluidos en esta categoría se encuentran: el análisis de correlación canónica y los boosted regression trees.

1.3.3.1. Análisis de correlación canónica (ACC).

El ACC se utiliza para determinar la relación lineal entre dos grupos de variables métricas, un grupo de variables independientes y otro grupo de variables dependientes. Esto es, dadas dos o más variables X y dos o más variables Y, se quiere describir la asociación entre estos dos conjuntos o grupos de variables.

Este análisis provee una medida de correlación entre una combinación lineal de las variables en un conjunto (p variables X), con una combinación lineal de las variables en el otro conjunto (m variables Y).

En un primer paso el análisis determina el par de combinaciones lineales con máxima correlación. En un segundo paso, identifica el par con máxima correlación entre todos los pares no correlacionados con el par de combinaciones seleccionadas en el primer paso y así sucesivamente. Las combinaciones lineales de un par son llamadas variables canónicas y la correlación entre ellas es llamada correlación canónica. El coeficiente de correlación canónica obtenido al cuadrado representa la proporción de la varianza total explicada por cada variable canónica.

158

1.3.3.2. Boosted regression trees (BRT).

El análisis de BRT es un método de ensamblaje relativamente nuevo que baraja la perspicacia y la técnica tanto de la estadística tradicional como del aprendizaje de computadora (machine-learning), y que busca predecir una variable regresora a partir de dos o más variables predictoras. El método BRT difiere del método de regresión tradicional en que, a través de la técnica de boosting, genera un único modelo (“mejor”) a partir de la combinación de un gran número de modelos simples (árboles de clasificación-regresión) para optimizar el rendimiento predictivo del modelo final (BRT) (Elith et al., 2008). Este modelo provee una ganancia significativa en el rendimiento predictivo comparado con el análisis de regresión múltiple, ya que es robusto a la colinealidad de las variables, a los datos anómalos, a la falta de datos y puede incluir tanto variables categóricas como continuas. Adicionalmente tiene la habilidad de modelar respuestas no lineales y detectar y modelar las interacciones entre las variables (Leathwick et al., 2008).

A diferencia de los modelos de regresión convencionales, el análisis de BRT se enfoca en la exactitud predictiva en vez del valor p para indicar la significancia de los coeficientes del modelo.

160

Tabla II.1.Cuantificación de polifenoles en la FL y en la FU de extractos de trigo en cuatro zonas diferentes (SUB I, SUB IIN, SUB IV y SUB VN).

Zona

Compuesto SUB I SUB IIN SUB IV SUB VN

Fracción Libre

1 ác. 2-hidroxi-3-O-β-D-glucopiranosilbenzoico 0,10 ± 0,06 a 0,06 ± 0,05 a 0,10 ± 0,11 a 0,02 ± 0,04 b