Chapter 6 Increasing Schedule Flexibility Using Checkpointing
7.1. Summary
APORTACIONES
Modelos lineales versus logísticos
Para la comparación de los tres modelos construidos (uno lineal y dos logísticos) se consideraron: efectos principales, ajuste a los datos, capacidad predictiva global, porcentaje de varianza explicado, contribución de casos (o configuraciones de covariables) con ajuste pobre al ajuste y / o a las estimaciones.
En los tres modelos lineales ajustados inicialmente las calificaciones en materias básicas de primer año y los antecedentes preuniversitarios son buenos predictores del avance en la carrera. Las puntuaciones en las componentes resultantes del ACP y basadas en el Rendimiento en Quimica (X1 ) y Rendimiento en Biología (X2 ) presentan
una relación significativa y directa con el avance en la carrera, siendo las que más contribuyen a explicar el avance en el análisis de regresión lineal. La componente representada por rendimiento en matemáticas (X3) presenta una relación significativa
con el avance, pero de menor intensidad que las otras dos componentes.
Resultados semejantes se encuentran cuando se utilizan las tres variables originales de rendimiento previo en Biología, Matemáticas y Química en el análisis de regresión logística, bajo cualquiera de las dos pautas de dicotomización.
Estos resultados son consistentes con la primera hipótesis planteada y están en concordancia con los resultados de Bivin y Rooney (1999) sobre predicción del progreso académico mediante modelos tobit.
Tanto en el modelo lineal como en los logísticos se observa una ausencia de relación de la variable sexo con el avance en la carrera. Nuestros resultados están en consonancia con los hallados por Clifton y otros (2004), quienes no encontraron asociación entre rendimiento y sexo, y por Van den Berg y Hofman (2005), quienes no encontraron diferencias entre hombres y mujeres en estudios tecnológicos al considerar los cursos acumulados en términos de créditos.Sin embargo los resultados del presente trabajo no concuerda con los encontrados por algunos autores al examinar los estilo de aprendizaje de hombres y mujeres (Lundeberg y Diemert, 1995; Martínez, 1997) y los de Yorke (2004). Quizá la ausencia de relación entre sexo y avance en la carrera observada en esta investigación sea específica del campo de estudios considerado. Habría que ver si estos resultados se mantienen en otros contextos universitarios.
Tampoco se encontraron efectos significativos de la variable lugar donde cursó Enseñanza Media para ninguno de los tres modelos (el lineal y los dos logísticos). Ello indica que, si bien el avance en la carrera resulta diferente según el lugar donde se ha cursado, en presencia de los restantes factores considerados dicho efecto carece de significación.
En el modelo de regresión lineal se obtienen efectos significativos para el tipo de Bachillerato. El pronóstico es más favorable para los estudiantes que cursaron Bachillerato de Ingeniería en relación con sus pares de Medicina. En los modelos
logísticos dicho efecto no pudo validarse. El tipo de Enseñanza Media tiene un efecto significativo en el modelo lineal y en el modelo logístico para el rezago según pauta teórica, siendo en ambos casos más favorable el pronóstico para alumnos procedentes de Enseñanza Media privada. No obstante, al igual que en el caso del Bachillerato, no se pudo confirmar este efecto en el modelo logístico. No existen estudios dentro del mismo sistema educativo con los que comparar nuestros resultados, aunque Naylor y Smith (2002) encuentran diferencias opuestas a las halladas aquí en el sistema educativo inglés.
Por tanto podemos concluir que la primera hipótesis se cumple en su primera parte, ya que el rendimiento académico previo está directa y significativamente asociado al avance en la carrera, pero se cumple sólo parcialmente por lo que se refiere a las variables demográficas, ya que sólo el efecto del tipo de institución resultó significativa.
En cuanto al ajuste de los modelos a los datos, el modelo lineal explica un 50 % de la varianza del avance. Si bien este resultado es mejor que el obtenido en trabajos que emplean las calificaciones como indicador de rendimiento (17%, García y otros, 2000), aún queda un 50% de varianza sin explicar, lo cual evidencia la necesidad de incluir otras variables predictoras en la ecuación.
Los modelos logísticos muestran un buen ajuste a los datos, como indican los distintos estadísticos de bondad de ajuste utilizados (Pearson, desviación, Hosmer y Lemeshow) y la razón entre dichos estadísticos y los correspondientes grados de libertad (Brown, 1976). Además presentan una buena capacidad predictiva global, entre 75% y 85%, en concordancia con los resultados de García y otros (2000), pese a que en el presente estudio no se tomaron en cuenta factores de orden psicosocial. Estos resultados son consistentes con la hipótesis 2.
En cuanto a los estadísticos de diagnóstico (McCullagh y Nelder, 1989), la eliminación de los casos identificados como de influencia introduce mejoras significativas en el ajuste global del modelo lineal (R2
corregido aumenta en un 19%) así
como en la magnitud de los parámetros, más allá de sus errores de estimación. Este hallazgo no puede ser contrastado con los resultados de otros autores, pues en los artículos consultados no se encontró alusión a estadísticos de diagnóstico. Para los modelos logísticos, en cambio, ni la capacidad predictiva global ni las estimaciones de los parámetros cambian por la eliminación de ninguno de los patrones con ajuste pobre. Aunque en este caso la regresión logística parece ser más robusta que la lineal frente a los casos de ajuste pobre, este hallazgo requeriría un estudio estadístico más profundo.
Criterio de dicotomización estadístico versus pauta teórica
Los modelos logísticos obtenidos según los dos puntos de corte empleados para dicotomizar el avance arrojan resultados consistentes, en términos generales, si bien la validación del modelo logístico para el rezago según la pauta teórica resulta menos satisfactoria que para el rezago normativo.
Para ambos modelos los términos de rendimiento previo resultan buenos predictores del rezago, si bien se observan diferencias en los efectos de las variables demográficas. El ajuste de los modelos a los datos y la capacidad predictiva global son satisfactorios para los dos modelos. Los valores de sensibilidad y especificidad muestran que el modelo obtenido al emplear la dicotomización según mediana clasifica
adecuadamente tanto a las situaciones de ajuste como a las de rezago, en tanto que al emplear la pauta teórica el modelo tiene una muy buena eficacia en términos de predicción de rezago, no así de ajuste, cuyo porcentaje de acierto se corresponde con el del azar. Para ambos modelos las estimaciones y la capacidad predictiva resultan prácticamente inalteradas por la eliminación de patrones de influencia.
Otro punto en común de los dos modelos ajustados es el comportamiento de las variables explicativas cuantitativas frente al supuesto de linealidad con el logit. En ambos casos los rendimientos en Química y en Biología cumplen con el supuesto, en tanto que el rendimiento en Matemática no. El efecto de dicotomización de esta variable (adoptando 6 como punto de corte) es diferente en ambos modelos. En la predicción del rezago normativo la razón de ventajas (odds ratio) (Hosmer y Lemeshow, 1989) del rendimiento en Matemática dicotomizado varía entre 1,7 y 7. En cambio en la regresión del rezago según pauta teórica, la estimación de dicho factor resulta muy inestable, variando su OR entre 1,4 y 77.
En resumen, la dicotomización de la variable criterio cuantitativa y su análisis mediante regresión logística no parece introducir sesgos en las estimaciones en general, permite hacer buenos pronósticos de avance en la carrera y arroja estimaciones de los efectos que resultan estables frente a la presencia de configuraciones de influencia.
Síntesis de aportaciones
En términos generales la segunda hipótesis planteada en este trabajo quedaría confirmada, ya que podemos concluir que la regresión logística parece ser más adecuada que la lineal, habida cuenta, además, de que no requiere el supuesto de normalidad de la variable explicada ni de homoscedasticidad y normalidad de los residuos. Las comparaciones realizadas sugieren que el modelo logístico ajustado para el rezago normativo es válido, puesto que los resultados de los dos grupos (de construcción y de validación) son muy similares.
Los resultados de esta investigación ponen de manifiesto que el rendimiento académico, medido a través del progreso en la carrera, también está influenciado por los antecedentes educativos de los estudiantes (Bivin y Rooney, 1999). Aquellos estudiantes con mejores calificaciones en primer año de la Facultad tienen menor riesgo de rezago curricular en el futuro, ya sea que el rezago esté referido a la norma del grupo como a la pauta teórica empleada en este trabajo. Además los estudiantes con formación previa de tipo ingeniera tienen mayores probabilidades de progresar adecuadamente en sus estudios, en relación con los alumnos con formación previa de tipo biológico. Los modelos hallados proporcionan por lo tanto un medio para predecir cambios en los créditos acumulados a lo largo de la carrera, a partir de cambios en la composición demográfica de la cohorte al ingreso.
Desde el punto de vista práctico y dada la preocupación actual acerca de la eficacia de las instituciones universitarias (Yorke, 2004) estos resultados pueden ser útiles para dichas instituciones de cara al establecimiento de sistemas que permitan mejorar las posibilidades de éxito de aquellos alumnos que están en desventaja al inicio de sus carreras universitarias.
Desde un punto de vista metodológico se recomienda siempre considerar los términos de interacción y reportar la comparación del modelo no aditivo con el modelo
de efectos principales. De acuerdo con la revisión realizada por Peng y otros (2002) en 52 artículos científicos sobre Educación Superior, solamente en 17 artículos los autores examinaron la posibilidad de efectos de interacción y/o confusión, siendo que en 2 de ellos de hecho examinaron el efecto de confusión, reportándolo como interacción. También se recomienda siempre analizar la presencia de posibles casos de influencia mediante estadísticos de diagnóstico. En este estudio se obtuvo una mejora sustancial de la varianza explicada por el modelo al eliminar casos que reunían las condiciones para ser considerados influyentes. Peng y otros (2002) señalan que ninguno de los 52 artículos revisados aportó información sobre estadísticos de diagnóstico.
LIMITACIONES
Como señalan Cumsille y Bangdiwala (2000), las conclusiones de un estudio están estrechamente vinculadas con las estrategias de análisis (en este caso regresiones lineal y logística) y con el procesamiento de los datos anterior a dicho análisis. Los resultados obtenidos en esta investigación corresponden a la medida de rendimiento académico elegida, pudiendo diferir para estudios de otros indicadores de rendimiento.
La variable criterio seleccionada es una variable cuantitativa en su escala original, que para los análisis logísticos fue dicotomizada según dos pautas. En ese marco, los resultados hallados fueron consistentes. Sin embargo, el empleo de otros criterios de dicotomización de la variable dependiente, así como de categorizaciones en un número de categorías ordenadas, podría eventualmente arrojar resultados diferentes según los puntos de corte seleccionados y las diversas técnicas logísticas existentes: binaria, ordinal de probabilidad acumulada, razón de continuidad, categorías adyacentes o politómica (Agresti, 1990; Ananth y Kleinbaum, 1997; Manor, Mathews y Power, 2000).
Por otra parte, en este trabajo no se han considerado factores de tipo psicosocial (estrategias de aprendizaje, motivación, autoconcepto, etc.) que, seguramente, incrementarían el valor predictivo de los modelos y que habrá que investigar en futuros trabajos.