• No results found

2.3. Theoretical framework

2.3.7. Experiential learning theory

En esta sección estudiaremos algunas de las posibilidades de análisis de dos variables nominales mediante las tablas de contingencia. si bien es posible aplicar estas técnicas para el estudio de dos variables ordinales, las tablas de contingencia no hacen uso de la ordenación intrínseca de los datos sino simplemente de su frecuencia en cada categoría por lo que no se explotan al máximo sus posibilidades: En estos casos podemos sacar “mayor rendimiento” utilizando el análisis de correlación.

Para analizar tablas de contingencia podemos utilizar diferentes estadísticos según el tamaño de la muestra y el número de categorías de cada variable, como podemos ver en la tabla siguiente:

Tabla 5.1. Tipo de estadístico en tablas de contingencia Número de categorías de ambas

variables Tamaño de la muestra Estadístico

2 x 2

n<100 Fisher

n100 Chi-cuadrado con la corrección de yates

Más de dos categorías en una de las

variables (o en las dos) Cualquiera Chi-cuadrado

Prueba Chi-cuadrado

La búsqueda de relación entre dos variables categóricas se realiza mediante la prueba no paramétrica Chi-cuadrado (2). Por ejemplo, ¿existe relación entre la ocurrencia o

no de alguna crisis cardiaca en el pasado año y el tipo de alimentación?

Teniendo en cuenta que una de las variables (ALIMENTA) tiene más de dos categorías, procedemos a utilizar el estadístico Chi-cuadrado, cuya hipótesis nula de la prueba es la independencia entre ambas variables.

Analyses → Nonparametric → Contingency Chi-Squared Analysis → Variable for Row Categories: Cardio; Variable for Column Categories: Alimenta. Marcando las casillas de “Show Observed Frequencies” y “Show Expected Frequencies” para ver las frecuencias observadas y las frecuencias teóricas, respectivamente, que habría en el caso de que ambas variables fueran independientes.

Figura 5.1. Cuadro de diálogo de la prueba Chi-Cuadrado

Chi-square Analysis Results for Cardio and Alimenta No. of Cases =50

OBSERVED FREQUENCIES Frequencies

COL. 1 COL. 2 COL. 3 Total

Row 1 18 10 6 34

Row 2 3 3 10 16

Total 21 13 16 50 EXPECTED FREQUENCIES

Expected Values

COL. 1 COL. 2 COL. 3 Row 1 14.280 8.840 10.880 Row 2 6.720 4.160 5.120

En la tabla Observed Frequencies, row 1 indica el primer valor de la primera variable (CArDIo=0) y row 2, el segundo (CArDIo=1). Las columnas CoL representan los valores de la variable ALIMENTA. Así, el cruce de row 1 y CoL 3 significa que hay 6 casos que no sufrieron ningún episodio cardiaco (CArDIo=0) y siguen una dieta rica en grasas (ALIMENTA=3).

Capítulo 5. Análisis bivariante

La siguiente tabla, Expected Frequencies, nos informa de que una celda tiene una frecuencia teórica inferior a 5 (CArDIo=1 y ALIMENTA=2), en concreto esta combinación tiene una frecuencia teórica igual a 4,16. si bien la prueba Chi-cuadrado exige que todas las frecuencias teóricas sean superiores a 5, puede admitirse esta prueba si: 1. Todas las frecuencias son superiores a 1, y

2. Las celdas que tienen una frecuencia entre 1 y 5 representan menos del 20% del total de celdas.

En nuestro caso sólo hay una celda con una frecuencia teórica inferior a 5, lo cual representa el 17% del total (1 de 6), por tanto la prueba Chi-cuadrado es válida. Cuanto mayores sean las diferencias entre las frecuencias observadas y las teóricas mayor será el valor del estadístico Chi-cuadrado y mayor la probabilidad de rechazar la hipótesis nula de independencia entre ambas variables. Continuando con el resultado de la prueba tenemos:

Chi-square = 10.344 with D.F. =2. Prob. > value = 0.006 Liklihood Ratio = 10.247 with prob. > value =0.0060 phi correlation =0.4548

Pearson Correlation r =0.4316

Mantel-Haenszel Test of Linear Association = 9.126 with probability > value =0.0025

The coefficient of contingency = 0.414

Cramer’s V = 0.455

En este caso, el valor del estadístico es igual a 10,247, con una probabilidad asociada de ocurrencia de 0,0060 (es decir, 0,6%). Como esta probabilidad es inferior a 0,05 (es decir, 5%) rechazamos la hipótesis nula de independencia entre ambas variables, por tanto concluimos que la dieta sí influye en la ocurrencia o no de la crisis cardiaca. También podemos comparar el valor calculado de la Chi y el valor crítico. En nuestro caso el estadístico calculado, si h0 es cierta, se distribuye como una Chi-cuadrado con 2 grados de libertad ([2-1]*[3-1], ya que una variable tiene dos categorías y la otra tres). En esta distribución la probabilidad de encontrarnos al azar un valor superior a 5,991 es de 0,05 (ver Anejo 2, fila=2 y columna=0,05). En nuestro ejemplo el valor del estadístico es 10,247, un valor muy superior al valor crítico (incluso superior a 9,21 que es el valor crítico correspondiente al 1% de probabilidad), por tanto rechazamos la hipótesis nula de independencia entre las dos variables.

Prueba de Fisher

Esta prueba está diseñada para tablas de contingencia 2x2 con un número de casos inferior a 100. supongamos que queremos determinar la influencia de sexo en la ocurrencia o no de una crisis cardiaca:

Analyses → Nonparametric → Fisher’s Exact Test for 2x2 Table: Variable for Row Categories: Sexo; Variable for Column Categories: Cardio.

Por defecto, el programa asume que los valores de las variables son 1 y 2. Esto es correcto para la variable sEXo pero no para la variable CArDIo, que toma los valores 0 y 1. Como esta variable la hemos situado en Column Variable, cambiamos los valores en la columna CoL por 0 y 1 (la columna roW es para la variable sEXo, que permanece con los valores 1 y 2), tal y como aparece en el cuadro de diálogo siguiente:

Figura 5.2. Cuadro de diálogo de la prueba Fisher de tablas de contingencia

Nota: Tanto en esta prueba como en el resto de análisis de tablas de contingencia es posible introducir los datos directamente en formato tabla indicando el número de casos en cada una de las celdas de la tabla de contingencia seleccionando la opción “Enter Frequencies on this form”.

Capítulo 5. Análisis bivariante

Fisher Exact Probability Test

Accumulating Values of the Hypergeometric Distribution Contingency Table for Fisher Exact Test

Column Row 1 2 1 14 9 2 20 7 Probability =0.1474 ... Cumulative Probability =0.2439 Null hypothesis accepted.

Chi-squared =0.995 with 1 d.f. and prob. > chi-square =0.3185 Log Odds = -0.608

Relative Risk = 0.822

Liklihood Ratio = 0.995 with prob. > value =0.3186

phi correlation =0.1411

Mantel-Haenszel Test of Linear Association = 0.975 with probability > value =0.3234

The coefficient of contingency = 0.140

Cramer’s V = 0.141

Teniendo en cuenta que la probabilidad acumulada (Cumulative Probability) es superior a 0,05 (alcanza un valor de 0,2439), se acepta la hipótesis nula (Null hypothesis accepted), esto es, ambas variables son independientes. La probabilidad del estadístico Chi-cuadrado también es superior a 0,05 (en concreto 0,3185) por lo que también se llega a la misma conclusión.

5.3. Diferencia entre dos grupos: Comparación de las medias