7.7 Control Board Design
7.7.1 Communication and Synchronisation
De acuerdo a los objetivos y las hipótesis de este estudio, un aspecto que interesaba analizar, era la influencia de las variables de asesoramiento en la percepción de los docentes respecto al impacto del asesoramiento de las ATE en diversas áreas de la escuela (factores). Para esto, se utilizó un análisis de regresión logística, el que permite establecer relaciones, predecir y explicar cómo se comporta una variable dependiente respecto a una o más variables independientes (categóricas). Hosmer y Lemeshow (2000) indican que el objetivo de la regresión logística es similar a otros modelos de regresión y se puede resumir en que es utilizado para: “encontrar el modelo más apropiado y más parsimonioso, pero (…) razonable para describir la relación entre una variable resultado (dependiente o respuesta) y un conjunto de variables independientes (explicativas o predictores) (p.1). Hair et al. (2014, p. 317) también concuerda con esta definición e indican que: “la regresión logística se puede describir como, la estimación de la relación entre una única variable dependiente no métrica (binaria) y un conjunto de variables independientes métricas o no métricas”, la forma general sería:
Y1 = X1 + X2 + X3 +… Xn
(binaria no métrica) (no métricas y métricas)
Por su parte Jovell (1995, p. 15) planeta que los objetivos del modelo de regresión logística son tres:
1. Determinar la existencia o ausencia de relación entre una o más variables independientes (Xi) y la variable dependiente (Y).
2. Medir la magnitud de dicha relación.
3. Estimar o predecir la probabilidad de que se produzca un suceso o acontecimiento definido como “Y = 1” en función de los valores que adoptan las variables independientes (Xi).
La principal diferencia entre este tipo de análisis y otros de similares características como la regresión lineal y la regresión múltiple, radica en que la variable dependiente debe ser binaria o dicotómica, donde sus valores son 0 y 1, que representan la ausencia o presencia de la característica, respectivamente (Hosmer y Lemeshow, 2000). En el caso de nuestra investigación, los valores de la variable dependiente
166 | P a tr i ci o La gos R e b ol l e d o.
representan; 0 la ausencia de impacto en la escuela y, 1 presencia del impacto del asesoramiento de la ATE en la escuela.
En lo que respecta a los supuestos del análisis logit, es recomendable que se cumplan el de ausencia de multicolinealidad que “representa el grado en el que cualquier efecto de una variable puede ser prevista o explicada por las otras variables del análisis” (Hair, 1999, p.21). El segundo supuesto, es la independencia de errores entre las variables, la regresión logística no es estricta en el cumplimiento de estos dos supuestos, como en otros análisis de regresión, aunque su cumplimiento hace más sólidos los resultados de su aplicación (Hair, 2014). Para analizar estos supuestos, se utilizó el factor de inflación de la varianza (FIV) para conocer la colinealidad de las variables independientes y, en el caso del supuesto de independencia de errores entre las variables, se utilizó el estadístico de Durbin-Watson.
Como se ha mencionado, la regresión logística es un análisis que sirve para la predicción de la probabilidad de ocurrencia de un suceso, en este sentido los valores de la probabilidad pueden ser cualquiera entre cero y uno, para definir una relación acotada entre cero y uno el análisis utiliza una relación supuesta entre las variables dependientes e independientes que se parece a una curva en forma de S (figura 10) (Hair et al., 1999, 2014).
Figura 12. Representación de la distribución de respuestas en la regresión logística.
Fuente: Hair et al. (1999).
En la figura 12 se representa que, para niveles muy bajos de la variable independiente la probabilidad se aproxima a cero. Según crece la variable independiente, también crece la probabilidad acercándose a uno, pero sin llegar a excederlo. P rob abi li da d d el s uc es o (V ar ia bl e d epe ndi en te )
Parte III. Marco metodológico.
167 | P a tr i ci o La gos R e b ol l e d o .
La particularidad de que en el análisis logístico exista la necesidad de saber si un suceso ocurre o no, se realiza mediante la estimación de la probabilidad de ocurrencia o no, en este sentido si la probabilidad es mayor que 0,05, entonces l predicción es sí, y no en otro caso (Hair et al., 1999). Para comprar la probabilidad de ocurrencia de un suceso o no se calcula el coeficiente logístico, también denominado odds ratio, y puede expresarse de la siguiente forma:
Los odds ratio se puede definir como un cociente entre el número de eventos y el número de “no eventos” (Cerda, Vera, y Rada, 2013). Los coeficientes estimados (B0, B1, B2,…, Bn) son medidas de los cambios en el ratio de probabilidades, (Hair et al., 1999), la interpretación de los coeficientes, una vez transformados mediante el software utilizado, sería que “un coeficiente positivo aumenta la probabilidad, mientras que un valor negativo disminuye la probabilidad predicha” (Hair et al., 1999, p. 283).
Para evaluar la significación de los coeficientes, en el análisis logit se recurre al estadístico de Wald, el que proporciona la significación estadística para cada coeficiente, de tal forma que se pueden contrastar hipótesis (Hair et al., 1999, 2014). El estadístico de Wald tiene el propósito de confirmar o rechazar que las categorías de una variable independientes no influyen en la probabilidad de ocurrencia de un suceso (Variable Dependiente) que se puede representar de la siguiente forma:
Para interpretar el contraste de hipótesis de que la variable independiente influye significativamente o no en la ocurrencia de un suceso en la variable dependiente, se estima el nivel de significación α de un 0,05. En el caso de que Wald sea distinto del valor 0 con un nivel de significancia menor al 0,05 se puede concluir que, la variable independiente (con sus categorías) es estadísticamente significativa, por lo tanto, influye en la probabilidad de que ocurra el suceso (variable dependiente), con lo cual, se acepta la H1 (Jovell, 1995) y se puede representar de la siguiente forma:
168 | P a tr i ci o La gos R e b ol l e d o.
Como el propósito de la regresión logística es intentar predecir un fenómeno, a partir de variables independientes, se debe tener en cuenta ciertos criterios para la inclusión de estas variables, Jovell (1995) menciona que son dos los criterios que se deben seguir:
1. Modelización estadística: en este caso, sólo se admiten las variables independientes que, una vez incluidas en el mismo, tienen una capacidad de predicción estadísticamente significativa.
2. Modelización sustantiva: Este criterio es más arbitrario, el investigador decide que variables independientes se deben incluir en el modelo en función de la hipótesis de investigación (p. 61).
La inclusión de variables independientes mediante modelización estadística, busca encontrar el modelo con el mejor ajuste global, para esto se puede optar por utilizar las opciones que incorporan los software estadísticos: 1) método de incorporación progresiva o inclusión secuencial de variables hacia adelante forward, 2) método de eliminación progresiva o exclusión secuencial de variables hacia atrás o backward y 3) método de inclusión paso a paso de variables o stepwise. Aunque también este procedimiento se puede realizar de forma manual, dejando al investigador la tarea de incorporar o eliminar variables independientes en base a la evaluación de los estadísticos de bondad de ajuste del modelo y de la capacidad predictiva del mismo.
Respecto de la valoración del ajuste global del modelo de regresión, Jovell (1995) indica que la idoneidad del modelo se puede valorar en base a tres criterios: 1) medida de bondad de ajuste, 2) medida de la eficacia predictiva y 3) detección de alteraciones en la bondad de ajuste del modelo (p.76). En la Tabla 42 se describen brevemente las pruebas para medir la bondad de ajuste del modelo de regresión de acuerdo a Jovell (1995).
Tabla 42. Medidas de la bondad de ajuste del modelo de regresión logística.
Medidas de bondad de ajuste Pruebas Descripción Análogas al coeficiente de determinación múltiple (R2)
Pseudo-R2 Ambas pruebas producen valores entre 0 y 1, de manera
que como más se acerquen al valor 1 mejor será la bondad de ajuste. Estas medidas constituyen aproximaciones, ya que para la regresión logística no resultan tan precias.
Medidas basadas en el logaritmo de verosimilitud (
Comparación de individuos o casos observados con los esperados o
Prueba de chi- cuadrado de Pearson
Se basa en el estudio de las probabilidades predichas para cada uno de los patrones de covariables.
Parte III. Marco metodológico. 169 | P a tr i ci o La gos R e b ol l e d o . predichos por la ecuación de regresión logística cuadrado de Hosmer y Lemshow
patrones de covariables y los de las probabilidades estimadas en perfiles definidos según criterios estadísticos. Valores bajos en la prueba de chi-cuadrado, asociados a valores de significación estadística elevados, son indicativos de que el modelo ajusta bien los datos. Valorar la posible presencia de patrones atípicos o valores extremos (conjunto de estadísticos de diagnóstico) Medida de los valores residuales
La función es la detección de posibles defectos de predicción producidos en observaciones o sujetos en los que el modelo no predice bien el valor observado (Y) para esa observación o individuo.
Medida del patrón de influencia
Detecta aquellos sujetos u observaciones que presentan patrones de variables independientes atípicos que son inusuales si se comparan con el resto de los individuos u observaciones incluidas en el modelo.
Medidas de influencia
Mide la contribución de una observación individual al desajuste o modificación de un coeficiente estimado, y que depende de la presencia de un valor residual y un patrón de influencia alterado.
Fuente: adaptación a partir de Jovell (1995).
Hair et al. (1999) menciona que la medida de ajuste global del modelo de regresión, está dada por el valor de la verosimilitud, que describe como “- 2veces el logaritmo del valor de verosimilitud y se representa por -2 LL” (p.283). En este caso un modelo con un buen ajuste adquiere valores pequeños para 2LL.