Chapter 2 Literature review
2.1 Initiation, Adoption and Adaptation Process of Social Media in Microbusinesses
2.1.3 Identifying training needs and methods for microbusinesses
2.1.3.1 Quick start training
Considérese una población homogénea de individuos (estudiantes), i=1,...,n, los cuales pueden experimentar el evento de interés (deserción) asumiendo que para cada individuo éste no es repetible, es decir, una vez que el evento ocurre no es posible que se presente nuevamente21.Con el fin de regis-
trar la ocurrencia del evento, supóngase, además, que dicha población es
20. Véase especialmente Lawless (1982), Lancaster (1992) y Hosmer y Lemeshow (1999).
21. A esta población se le conoce como el conjunto de riesgo, definido como el grupo de individuos (u observaciones) que son susceptibles de experimentar el evento en un punto particular del tiempo (Willett y Singer, 1993).
observada o monitoreada por un periodo de tiempo limitado a partir de t=0, en el cual el individuo puede presentar o no el evento de interés, obteniéndose en este último caso información incompleta sobre la ocurrencia del evento, por lo que la observación o el individuo se considera censurado22.Esta definición
hace referencia al censuramiento a derecha, el cual el más común en este tipo de aplicaciones. El censuramiento a izquierda se da cuando no es posible deter- minar desde qué momento el individuo puede presentar el evento de interés. Para la descripción de otros tipos de censuramiento véase: Lawless (1982), Kiefer (1988), Lancaster (1992), Hosmer y Lemeshow (1999) y Jenkins (2005). La presencia de censura en los datos complica el análisis estadístico gene- rando dificultades en la estimación e inferencia sobre los parámetros estima- dos debido a que estas proveen información incompleta sobre la ocurrencia del evento, alterando la función de verosimilitud empleada en la estimación de los modelos, y las propiedades de los estimadores obtenidos (Singer y Willett, 1991). Sin embargo, el análisis de supervivencia permite incorporar esta información y con ello eliminar los problemas mencionados. Así, para el caso del análisis de la deserción estudiantil, los estudiantes aún activos y los que se graduaron se constituyen en individuos censurados puesto que una vez finalizado el proceso de observación de la población éstos no presentaron el evento de desertar.
4.1.2. Las funciones de supervivencia y de riesgo
Puesto que la población se está monitoreando en el tiempo hasta que se presente o no el evento, la variable de interés en los modelos de duración es el tiempo de duración hasta la ocurrencia de éste, es decir, el tiempo que ha durado el estu- diante hasta el momento de desertar. Así, considérese a T como una variable aleatoria continua no negativa, la cual denota los tiempos de duración de los individuos de la población. Esta variable con función de densidad de probabili- dad f(t) y función de distribución acumulada F(t) = P(T ≤ t), también conocida en la literatura de análisis de supervivencia como función de falla, puede
22. Para una descripción detallada sobre asuntos tales como a qué y cuántos individuos estudiar, la definición del evento de interés, la identificación del momento de inicio y la longitud del proceso de monitoreo de la población, el tratamiento cuando se presentan repetición de eventos, entre otros, véase Singer y Willett, 1991.
caracterizarse de manera única por su función de supervivencia, denotada como S(t) y dada por
S(t) = 1 – F (t) = 1 – P (T ≤ t) = P(T > t), (1)
Esta función representa la probabilidad de que el tiempo de duración de ocu- rrencia del evento sea mayor o igual que t, o en otras palabras, la probabilidad de que el individuo sobreviva hasta el tiempo t. Nótese que, dado que la función de supervivencia depende del tiempo t, ésta permite analizar el patrón de comportamiento de las probabilidades de supervivencia a través del mismo23.
En consecuencia, dicha función es de gran importancia para el estudio de la deserción estudiantil, puesto que ofrece información sobre la evolución cro- nológica de la probabilidad de supervivencia de los estudiantes en los diferen- tes periodos académicos.
Igualmente, otra función de gran importancia, considerada como el corazón del análisis de duración, es la función de riesgo24,denotada por h(t), la cual
expresa la probabilidad de que el evento ocurra en el período t condicionado a que ha sobrevivido hasta t. Esta función se expresa como:25
h(t) = P (t ≤ T ≤ ∆ T ≥ t) = f (t T > t) = f (t) / S (t) > 0 (2)
Su importancia se basa en el hecho de que la función de riesgo responde a las dos cuestiones mencionadas antes, esto es, si el evento de deserción ocurre y, en caso afirmativo, cuándo ocurrió éste; incluyendo la información corres- pondiente a los individuos censurados. Nótese que con el conocimiento de la función de distribución F(t) se puede determinar la función de riesgo h(t). En términos del fenómeno de la deserción estudiantil, la función de riesgo se puede interpretar como la probabilidad de que un estudiante abandone volun- tariamente sus estudios en el momento t sujeto a que ha permanecido activo hasta ese momento t.26
23. S(t) es una función estrictamente decreciente de t. Véase la literatura recomendada antes para otras propiedades de la función de supervivencia. 24. La función de riesgo también se conoce con los nombres de tasa de
riesgo o de falla condicional o como la tasa inversa de Mill. 25. Una definición más precisa de la función de riesgo está dada por:
h(t) = lim P (t ≤ T ≤ ∆t T ≥ t) = ∂F (t) 1 = f (t) ______________ ____ ______ ___ ∆t →0 ∆t dt 1— F(t) S(t)
26. En la práctica, las funciones de riesgo paramétricas más empleadas para modelar la distribución de los tiempos de duración son las distribuciones exponencial, Weibull, log-logística, log-normal, Gompertz, inversa Gaussiana, F generalizada y Gamma, así como mezclas o combinaciones de algunas de éstas (Kiefer, 1988 y Jenkins, 2005).
4.1.3. Poblaciones heterogéneas
Hasta el momento, se ha asumido que el conjunto de individuos que son sus- ceptibles de experimentar el evento de interés está constituido por una pobla- ción homogénea. Sin embargo, dado que el interés en muchas aplicaciones, en especial en el estudio de la deserción estudiantil, se centra en analizar y cuan- tificar el impacto que tienen los diferentes factores sobre la función de riesgo, entonces se requiere extender el análisis de duración a poblaciones heterogé- neas suponiendo que la función de riesgo h(t), es explicada por un conjunto de características observables propias de cada individuo. En el caso particular del fenómeno de la deserción, interesa estimar el riesgo de que el i-ésimo estu- diante deserte en el t-ésimo momento, sujeto a un conjunto de variables de tipo socioeconómico, académico, individual e institucional, lo cual se puede expresar como:
h (t|x
i (t),β) = f (t|xi (t),β) / S (t|xi (t),β) (3)
donde xi (t) es un vector de variables predictoras asociado con la i-ésima observación que resume la heterogeneidad observada en el instante t y β es el correspondiente vector de parámetros desconocidos a ser estimados. Aná- logamente a lo que se hace en el análisis de regresión convencional, se busca determinar el efecto de las variables incluidas en xi (t) sobre el riesgo de ocu- rrencia del evento, a partir de la estimación de dichos parámetros.
La ecuación anterior implica que la metodología de los modelos de duración aplicada al fenómeno de la deserción estudiantil permite calcular, tanto la probabilidad de que el estudiante deserte sujeto al tiempo que ha permane- cido vinculado a la institución, como los principales factores que pueden llevar a tomar la decisión de abandonar los estudios y, como se mencionó ante- riormente, permite al investigador obtener más conocimiento sobre la evolu- ción de la deserción a través del tiempo.
Así, aplicados a la población universitaria, los modelos de duración permiten conocer cuál es la probabilidad de que un estudiante, con ciertas característi- cas, deserte en el semestre actual dado que no lo ha hecho hasta ese momento y, adicionalmente, en qué semestres los estudiantes presentan mayor riesgo de desertar, es decir, determinar las diferencias de riesgo entre estudiantes de los primeros semestres de la carrera con respecto a los estudiantes de los semestres finales para diferentes áreas del conocimiento y programas acadé-
micos. En este sentido, es posible evaluar, por ejemplo, el impacto de las polí- ticas de apoyo financiero y de bienestar universitario y cuándo éstas son más importantes como una vía para reducir la deserción dentro del recorrido aca- démico del estudiante.