2.3. Theoretical framework
2.3.7. Experiential learning theory
En esta sección estudiaremos algunas de las posibilidades de análisis de dos variables nominales mediante las tablas de contingencia. si bien es posible aplicar estas técnicas para el estudio de dos variables ordinales, las tablas de contingencia no hacen uso de la ordenación intrínseca de los datos sino simplemente de su frecuencia en cada categoría por lo que no se explotan al máximo sus posibilidades: En estos casos podemos sacar “mayor rendimiento” utilizando el análisis de correlación.
Para analizar tablas de contingencia podemos utilizar diferentes estadísticos según el tamaño de la muestra y el número de categorías de cada variable, como podemos ver en la tabla siguiente:
Tabla 5.1. Tipo de estadístico en tablas de contingencia Número de categorías de ambas
variables Tamaño de la muestra Estadístico
2 x 2
n<100 Fisher
n100 Chi-cuadrado con la corrección de yates
Más de dos categorías en una de las
variables (o en las dos) Cualquiera Chi-cuadrado
Prueba Chi-cuadrado
La búsqueda de relación entre dos variables categóricas se realiza mediante la prueba no paramétrica Chi-cuadrado (2). Por ejemplo, ¿existe relación entre la ocurrencia o
no de alguna crisis cardiaca en el pasado año y el tipo de alimentación?
Teniendo en cuenta que una de las variables (ALIMENTA) tiene más de dos categorías, procedemos a utilizar el estadístico Chi-cuadrado, cuya hipótesis nula de la prueba es la independencia entre ambas variables.
Analyses → Nonparametric → Contingency Chi-Squared Analysis → Variable for Row Categories: Cardio; Variable for Column Categories: Alimenta. Marcando las casillas de “Show Observed Frequencies” y “Show Expected Frequencies” para ver las frecuencias observadas y las frecuencias teóricas, respectivamente, que habría en el caso de que ambas variables fueran independientes.
Figura 5.1. Cuadro de diálogo de la prueba Chi-Cuadrado
Chi-square Analysis Results for Cardio and Alimenta No. of Cases =50
OBSERVED FREQUENCIES Frequencies
COL. 1 COL. 2 COL. 3 Total
Row 1 18 10 6 34
Row 2 3 3 10 16
Total 21 13 16 50 EXPECTED FREQUENCIES
Expected Values
COL. 1 COL. 2 COL. 3 Row 1 14.280 8.840 10.880 Row 2 6.720 4.160 5.120
En la tabla Observed Frequencies, row 1 indica el primer valor de la primera variable (CArDIo=0) y row 2, el segundo (CArDIo=1). Las columnas CoL representan los valores de la variable ALIMENTA. Así, el cruce de row 1 y CoL 3 significa que hay 6 casos que no sufrieron ningún episodio cardiaco (CArDIo=0) y siguen una dieta rica en grasas (ALIMENTA=3).
Capítulo 5. Análisis bivariante
La siguiente tabla, Expected Frequencies, nos informa de que una celda tiene una frecuencia teórica inferior a 5 (CArDIo=1 y ALIMENTA=2), en concreto esta combinación tiene una frecuencia teórica igual a 4,16. si bien la prueba Chi-cuadrado exige que todas las frecuencias teóricas sean superiores a 5, puede admitirse esta prueba si: 1. Todas las frecuencias son superiores a 1, y
2. Las celdas que tienen una frecuencia entre 1 y 5 representan menos del 20% del total de celdas.
En nuestro caso sólo hay una celda con una frecuencia teórica inferior a 5, lo cual representa el 17% del total (1 de 6), por tanto la prueba Chi-cuadrado es válida. Cuanto mayores sean las diferencias entre las frecuencias observadas y las teóricas mayor será el valor del estadístico Chi-cuadrado y mayor la probabilidad de rechazar la hipótesis nula de independencia entre ambas variables. Continuando con el resultado de la prueba tenemos:
Chi-square = 10.344 with D.F. =2. Prob. > value = 0.006 Liklihood Ratio = 10.247 with prob. > value =0.0060 phi correlation =0.4548
Pearson Correlation r =0.4316
Mantel-Haenszel Test of Linear Association = 9.126 with probability > value =0.0025
The coefficient of contingency = 0.414
Cramer’s V = 0.455
En este caso, el valor del estadístico es igual a 10,247, con una probabilidad asociada de ocurrencia de 0,0060 (es decir, 0,6%). Como esta probabilidad es inferior a 0,05 (es decir, 5%) rechazamos la hipótesis nula de independencia entre ambas variables, por tanto concluimos que la dieta sí influye en la ocurrencia o no de la crisis cardiaca. También podemos comparar el valor calculado de la Chi y el valor crítico. En nuestro caso el estadístico calculado, si h0 es cierta, se distribuye como una Chi-cuadrado con 2 grados de libertad ([2-1]*[3-1], ya que una variable tiene dos categorías y la otra tres). En esta distribución la probabilidad de encontrarnos al azar un valor superior a 5,991 es de 0,05 (ver Anejo 2, fila=2 y columna=0,05). En nuestro ejemplo el valor del estadístico es 10,247, un valor muy superior al valor crítico (incluso superior a 9,21 que es el valor crítico correspondiente al 1% de probabilidad), por tanto rechazamos la hipótesis nula de independencia entre las dos variables.
Prueba de Fisher
Esta prueba está diseñada para tablas de contingencia 2x2 con un número de casos inferior a 100. supongamos que queremos determinar la influencia de sexo en la ocurrencia o no de una crisis cardiaca:
Analyses → Nonparametric → Fisher’s Exact Test for 2x2 Table: Variable for Row Categories: Sexo; Variable for Column Categories: Cardio.
Por defecto, el programa asume que los valores de las variables son 1 y 2. Esto es correcto para la variable sEXo pero no para la variable CArDIo, que toma los valores 0 y 1. Como esta variable la hemos situado en Column Variable, cambiamos los valores en la columna CoL por 0 y 1 (la columna roW es para la variable sEXo, que permanece con los valores 1 y 2), tal y como aparece en el cuadro de diálogo siguiente:
Figura 5.2. Cuadro de diálogo de la prueba Fisher de tablas de contingencia
Nota: Tanto en esta prueba como en el resto de análisis de tablas de contingencia es posible introducir los datos directamente en formato tabla indicando el número de casos en cada una de las celdas de la tabla de contingencia seleccionando la opción “Enter Frequencies on this form”.
Capítulo 5. Análisis bivariante
Fisher Exact Probability Test
Accumulating Values of the Hypergeometric Distribution Contingency Table for Fisher Exact Test
Column Row 1 2 1 14 9 2 20 7 Probability =0.1474 ... Cumulative Probability =0.2439 Null hypothesis accepted.
Chi-squared =0.995 with 1 d.f. and prob. > chi-square =0.3185 Log Odds = -0.608
Relative Risk = 0.822
Liklihood Ratio = 0.995 with prob. > value =0.3186
phi correlation =0.1411
Mantel-Haenszel Test of Linear Association = 0.975 with probability > value =0.3234
The coefficient of contingency = 0.140
Cramer’s V = 0.141
Teniendo en cuenta que la probabilidad acumulada (Cumulative Probability) es superior a 0,05 (alcanza un valor de 0,2439), se acepta la hipótesis nula (Null hypothesis accepted), esto es, ambas variables son independientes. La probabilidad del estadístico Chi-cuadrado también es superior a 0,05 (en concreto 0,3185) por lo que también se llega a la misma conclusión.