Cuando
existe duda respecto a la normalidad dela población o cuando la población no es normal es conveniente emplear una prueba no paramétrica, que como ya se mencionó en el capítulo 3 no parten del principio de normalidad. Asimismo, las pruebas no paramétricas se clasifican en tres grupos: para una muestra simple, para muestras relacionadas y para muestras independientes.Debido a la amplia variedad de pruebas en cada uno de estos grupos, en este capítulo sólo se describirán las de mayor uso en la investigación en psicología.
Pruebas para una muestra simple
Generalmente las pruebas para una muestra simple son pruebas de bondad de ajuste que tienen como objetivo conocer la distribución de la muestra.
Chi cuadrada (X2)
La chi cuadrada es la prueba más empleada en la investigación en psicología. Esta prueba se aplica para comparar las frecuencias esperadas (poblacionales) y las frecuencias obtenidas (muestra) y a partir de esta comparación decidir si existen diferencias significativas. Las frecuencias esperadas se refieren a la hipótesis nula (Ho) y las frecuencias obtenidas son los resultados alcanzados por el investigador. De este modo, mientras mayor sea el valor de X2 menor es la probabilidad de que las frecuencias obtenidas se deban a la población, esto
La fórmula para obtener las fe es fe= N /k donde:
N = número de personas.
k = número de categorías o columnas.
De esta manera, el procedimiento para obtener la X2 consiste en restar cada frecuencia esperada de su correspondiente frecuencia obtenida, la diferencia de esta resta, se eleva al cuadrado y se divide entre la frecuencia esperada, estos resultados parciales se suman y se obtiene el valor de la chi cuadrada.
Una vez que se obtiene el valor de la chi cuadrada, se requiere conocer los grados de libertad (gl) que se definen como la amplitud de variación contenida en una condición de investigación, lo que significa la posibilidad de variación (Kerlinger y Lee, 2001; Downie y Heath, 1973). Asimismo, junto con los grados de libertad, se requiere de una tabla de valores de X2 para conocer de acuerdo con los gl y al valor de la X2, si ésta es o no significativa.
Sofía Rivera Aragón Mirna García Méndez 84
significa que el valor de chi cuadrada es significativo si la diferencia entre las frecuencias esperadas y las frecuencias obtenidas es lo suficientemente grande (Siegel y Castellan, 2003; Levin y Levin, 2002). Su fórmula es:
suma de todas las casillas, de la primera a la última. frecuencia obtenida,
frecuencia esperada. donde:
La fórmula para obtener los grados de libertad es: gl = k - 1
donde:
k = número de columnas de la tabla de contingencia
También la X2 se utiliza en muestras independientes, en este caso se le conoce como prueba de homogeneidad y su objetivo es conocer si existen diferencias entre dos o más grupos.
Un tercer uso de esta prueba, es como prueba de independencia, aquí su objetivo es conocer si existen relaciones entre dos o más variables en una muestra.
Un cuarto uso es como prueba de corrección por continuidad de Yates, la cual le da mayor precisión a la X2 cuando tiene fe pequeñas.
En los tres primeros casos -bondad de ajuste, homogeneidad, independencia- la chi cuadrada se obtiene con la misma fórmula.
Reglas para su empleo
1. Las observaciones deben ser independientes, no se puede observar o medir a la misma persona más de una vez.
2. El nivel de medición utilizado será nominal u ordinal. 3. Se aplicará en muestreos no probabilísticos.
4. La muestra deberá ser mayor a 20 {N > 20).
5. Si la muestra N < 20 entonces se utiliza la prueba de probabilidad exacta de Fisher.
6. Las frecuencias esperadas deben ser mayores a 5.
7. Si la frecuencia esperada es > 5 y < 10, entonces se aplica la corrección por continuidad de Yates.
8. Si la N > 20 y < 40, se aplica la prueba de corrección por continuidad de Yates.
9. Si la tabla de contingencias es de 1 X i columnas, se aplica la X2 de
bondad de ajuste.
Pruebas de la estadística no paramétrica 85
10. Si la tabla de contingencia ese de 2 x 2 y cumple los requisitos 7 y 8, se aplica la prueba de corrección por continuidad de Yates.
Procedimiento
1. Plantear las hipótesis estadísticas.
2. Determinar la probabilidad con la que se trabajará: p = .05, p = .01. 3. Distribuir los puntajes en la tabla de contingencia.
4. Calcular las frecuencias esperadas: 5. Aplicar la fórmula.
6. Obtener los gl.
7. Plantear regla de decisión.
Este estudio tiene como propósito identificar el consumo de productos chatarra, en una muestra de 60 niños preescolares de la ciudad de México, así como la preferencia por alguno de estos productos. Entendiéndose por productos chatarra: pastelitos, frituras, refrescos y dulces.
Paso 1. Hipótesis.
Ho: no existen diferencias significativas en el consumo de productos chatarra en niños preescolares.
H1: existen diferencias significativas en cuanto al consumo de productos chatarra por parte de los niños preescolares.
Paso 2. Nivel de significancia p = .05. Paso 3. Distribución de los datos.
Pastelitos Frituras Refrescos Dulces N
fo fe
15 15 28 15 fo fe 0 15 fo fe 7 15 fo fe 60 Paso 4. Cálculo de fe.
Sofía Rivera Aragón Mirna García Méndez
Paso 6. Obtener los grados de libertad. gl = k - 1 gl = 4 - 1 gl = 3 Paso 7. Regla de decisión.
X2 ≥ X2t
H1 se acepta y Ho se rechaza.X2t = chi cuadrada en tablas. En la tabla A del apéndice, se busca en la parte horizontal, el nivel de significancia previamente establecido .05, y en la parte vertical los gl, que en este ejemplo fue de 1. Esto resulta en lo siguiente:
17.18 ≥ 7.82. Se acepta la H1
Pruebas de la estadística no paramétrica 87
Interpretación de resultados
Se encontraron diferencias significativas X2 = 1 7 . 1 8 , p = .05 en el consumo de alimentos chatarra en los niños preescolares, lo que significa que difieren en el consumo de estos productos.
Ejercicio
SPSSSe empleará el mismo ejercicio desarrollado por la fórmula de preferencias de productos chatarra por niños preescolares.
Paso 1. Se crea una variable que se denominará preferencias e incluirá 5 niveles de respuesta: 1 = pastelitos; 2 = frituras; 3 = refrescos; y 4 = dulces.
Debido a que incluir las respuestas de los 60 niños en la base de datos implica mucho espacio, únicamente se presentarán los datos de 10 niños, pero el análisis y los resultados se llevarán a cabo con el total de las respuestas de los participantes.
De esta manera la base de datos queda así:
Sofía Rivera Aragón Mirna García Méndez 88
Paso 2. Se coloca el cursor en Analyze, se presiona el botón izquierdo del mouse y se muestra un menú en el que se coloca el cursor en Non-parametric test, aparece un menú en el que se coloca el cursor en Chi- Square y se da clic.
Paso 3. Al hacer clic en Chi-Square se abre un menú.
Pruebas de la estadística no paramétrica 89
Paso 4. En el menú del paso 3, se marca con el cursor la variable preferencias, se da clic en el icono ubicado entre la variable preferencia y Test Variable List, inmediatamente la variable preferencias aparece en Test Variable List.
Paso 5. Se da clic en OK y se muestran los resultados en tablas. PREFERENCIAS
Observed N Expected N Residual
Pastelillos 15 15.0 .0
Frituras 28 15.0 13.0
Refrescos 10 15.0 -5.0
Dulces 7 15.0 -8.0
Total 60
Sofía Rivera Aragón Mirna García Méndez
Como se puede observar en la tabla 20, la X2 y la p difieren un poco de los resultados con la fórmula desarrollada, esto se debe a que en el SPSS las
operaciones se realizan en forma precisa.
Interpretación de resultados
Se encontraron diferencias significativas X2 = 17.20, p = .001 en el consumo de alimentos chatarra en los niños preescolares, lo que significa que difieren en el consumo de estos productos.
Pruebas para muestras relacionadas
Estas pruebas implican dos medidas de una sola muestra. Se emplean cuando el investigador desea conocer si un tratamiento es mejor que otro o si dos tratamientos son diferentes. En este tipo de estudios se pueden em-
TEST STATISTICS
Preferencias
Chi-Squarea 17.200
df 3
Asymp. Sig. .001
a.0 cells (.0%) have expected frequencies less than 5. The
minimum expected cell frequency is 15.0.
Estas tablas no se presentan en el reporte de investigación, los datos contenidos en ellas se pueden presentar en tablas en otro formato.
TABLA 20
DIFERENCIAS EN EL CONSUMO DE PRODUCTOS CHATARRA
Pastelitos Frituras Refrescos Dulces X2 gl p
15 28 10 7 17.20 3 .00 1
N = 60.
Pruebas de la estadística no paramétrica 91
plear dos grupos, sin embargo, los resultados que se obtengan pueden estar relacionados con un conjunto de eventos ajenos al tratamiento. Estos eventos se conocen como variables extrañas. Con la finalidad de controlar el efecto de estas variables extrañas, la persona puede fungir como su propio control, esto es, se le expone a ambas condiciones en diferentes ocasiones. Otra alternativa es el método de apareamiento, en el que se seleccionan pares de personas lo más semejantes posible en torno de las variables extrañas que puedan influir en los resultados del tratamiento. El inconveniente de este método es que depende de la capacidad del investigador para establecer que tan iguales son los pares (Siegel y Castellan, 2003).
McNemar
Es una prueba útil en los diseños antes-después (Álvarez, 1995) en los que cada sujeto se utiliza como su propio control. En la prueba de McNemar el objetivo es probar la significación de los cambios observados a partir de una tabla de contingencia 2x2 (Siegel y Castellan, 2003; Conover, 1980).
Para probar la significancia de los cambios observados, los datos en la tabla expresan lo siguiente:
Sofía Rivera Aragón Mirna García Méndez 92
Los grados de libertad empleados en McNemar es 1. gl = 1.
Para obtener resultados más precisos, se emplea la corrección por continuidad que permite eliminar la fuente de imprecisión que resulta de emplear una distribución continua para aproximarse a una distribución discreta (Siegel y Castellan, 2003).
Con esta corrección, la fórmula se expresa de la siguiente manera:
Pruebas de la estadística no paramétrica 93 Los signos positivo y negativo sólo se emplean para indicar que hubo un cambio sin connotación de bueno o malo.
Como se observa en la tabla, A + D son las personas cuyas respuestas cambiaron. De esta manera, la Ho plantea que el número de cambios en cada dirección es el mismo. Sustituyendo la fórmula: suma frecuencia obtenida frecuencia esperada donde: se obtiene lo siguiente:
El signo | indica que al resultado de la resta de A - D, sin importar el signo + o - se le resta el 1. Por ejemplo, 6-15 = - 9, entonces se resta 9 - 1 = 8
Reglas para su empleo
• En mediciones nominales y ordinales.
• Que el número total de cambios sea mayor a 10.
• Cuando la frecuencia esperada es menor a 5, se debe usar otra prueba.
Procedimiento
1. Plantear las hipótesis estadísticas.
2. Determinar la probabilidad con la que se trabajará p=05, p = . 0 1 . 3. Distribuir los puntajes en la tabla de contingencia.
4. Aplicar la fórmula. 5. Plantear regla de decisión.
Ejercicio
Para evaluar la efectividad de un programa de intervención con 50 padres de familia de ciudad Nezahualcóyotl, se les preguntó si estaban de acuerdo o en desacuerdo con que sus hijos recibieran educación sexual en la escuela, tema a tratar como parte del programa a través de un taller. Antes del taller se les preguntó si estaban de acuerdo o en desacuerdo y al término del taller se les volvió a hacer la misma pregunta.
Paso 1. Hipótesis
Ho. La probabilidad de las madres que cambiaron de acuerdo a desacuerdo es igual a la probabilidad de las madres que cambiaron de desacuerdo a acuerdo en lo concerniente a que sus hijos reciban educación sexual en la escuela.
H1. Después de haber asistido a un taller, las madres aceptan que sus hijos reciban educación sexual en la escuela.
Paso 2. Nivel de significancia a emplear p = .05.
Sofía Rivera Aragón Mirna García Méndez
Paso 5. Regla de decisión.
X2 ≥ X2t
H1 se acepta e Ho se rechaza.X2t = chi cuadrada tablas. En la tabla A del apéndice, se busca en la parte horizontal, el nivel de significancia previamente establecido .05, y en la parte vertical los gl, que en este ejemplo fue de 1. Esto resulta en que se acepta la H1.
10.25 ≥ 3.84. Se acepta la H1.
Interpretación de resultados
Estos resultados indican que el taller influyó en la opinión, ya que las madres que estaban en desacuerdo con que sus hijos reciban educación sexual en la escuela, ahora en su mayoría están de acuerdo (X2 =10.25, p=.05)
Despues Desacuerdos Acuerdos Antes Acuerdos 9 6 Desacuerdos 5 30 Pruebas de la estadística no paramétrica 95
Paso 3. Distribución de las respuestas de los padres antes y después del taller.
Ejercicio SPSS
La base de datos contiene las respuestas de los 50 padres de familia; sin embargo, con fines prácticos en esta tabla únicamente se incluye la información de 20 padres. La base de datos del paso 2, sólo incluye 10 de los 20 casos, no obstante los análisis que se presentan son a partir de todos los casos
Paso 1. Se coloca el cursor en Analyze y se da clic en el botón izquierdo del mouse.
Paso 2. Al hacer clic en Analyze, aparece un menú en el que se coloca el cursor en Descriptive statistics, se da clic y aparece otro menú, se coloca el cursor en Crosstabs, se da clic.
Sofía Rivera Aragón Mima García Méndez 96
Paso 3. Al hacer clic en Crosstabs, se abre un menú en el que aparecen las dos condiciones de investigación (antes/después), se da clic en el cuadro de Statistics.
Pruebas de la estadística no paramétrica 97
Paso 4. Al hacer clic en Statistics se coloca el cursor en Chi-square y en McNemar, se da clic en el cuadro de cada una de éstas pruebas,- se coloca el cursor en Continue y se da clic.
Paso 5. Al hacer clic en Continue reaparece el menú del paso 3 de la investigación. Se coloca el cursor en antes y se da clic en el icono que está entre antes-después y Row(s), entonces antes se muestra en Row(s).
Sofía Rivera Aragón 98 Mirna García Méndez
Se coloca el cursor en después y se da clic en el icono que está entre antes- después y Column(s), entonces después aparece en Column(s). Se hace clic en OK y se muestran los resultados en tablas.
Una forma de presentar estos resultados es la siguiente:
La distribución de las respuestas de los padres de familia antes y después de haber tomado el taller se presenta en la tabla 21.
Pruebas de la estadística no paramétrica 99 Count ANTES-DESPUÉS CROSSTABULATION
Después Acuerdo Desacuerdo Total
ANTES Acuerdo 6 9 15
Desacuerdo 30 5 35
Total 36 14 50
CHI-SQUARE TESTS
Value df Asymp.Sig.
(2-sided) Exact sig. (2-sided) Exact sig. (1 sided)
Pearson Chi-Square 10.884b 1 .001
Countinity Correctiona 8.735 1 .003
Likelihood Ratio 10.397 1 .001
Fisher's Exact Test .002 .002
Linear-by-Linear 10.667 1 .001
Association
McNemar Test .00lc
N of Valid Cases 50
aComputed only for a 2x2 table.
bl cells (25.0%) have expected count less than 5. The minimum expected count is 4.20.
TABLA 21
DISTRIBUCIÓN DE RESPUESTAS DE LOS PADRES DE FAMILIA. Después
Desacuerdos Acuerdos
Antes Acuerdos 9 6
Desacuerdos 5 30
Con base en esta distribución de respuestas, se obtuvo una X2 — 10.88, p = .001 lo que indica diferencias significativas en los acuerdos/desacuerdos por parte de los padres, antes y después de asistir al taller, modificándose la respuesta de desacuerdo por acuerdo en lo concerniente a que sus hijos reciban educación sexual en la escuela.
t de Wilcoxon (t w)
La prueba t de Wilcoxon considera la magnitud relativa y la dirección de las diferencias, lo que la convierte en una prueba poderosa. Esta prueba otorga mayor peso a los pares que tienen mayores diferencias entre el antes y después que a los pares cuya diferencia es pequeña. De esta manera el investigador puede determinar qué miembro del par es más grande que, por lo que puede hacer juicios de mayor que entre los valores de cualquier par (Siegel y Castellan, 2003).
Procedimiento
1. Plantear hipótesis.
2. Determinar probabilidad alfa (α).
3. Obtener las calificaciones de la muestra antes y después. 4. Obtener las diferencias de la primera y segunda aplicación.
5. Ordenar de mayor a menor las diferencias (R) (se toma en cuenta el signo). Cuando la diferencia es cero, no se ordena.
6. Sumar por separado los rangos de los valores positivos (∑R+) Y los rangos de los valores negativos (∑R-).
Sofía Rivera Aragón Mirna García Méndez
7. Elegir el valor más pequeño de la ∑R+ o ∑R- el cual constituye la t de Wilcoxon.
8. Plantear la regla de decisión: t we ≤ t wr entonces (
) la hipótesis alterna se acepta y la hipótesis nula se rechaza.Ejercicio
El Instituto Nacional Indigenista plantea que en México existe discri- minación, si no al color de la piel, sí a los rasgos indígenas. De hecho se usa la expresión "eres un indio" como sinónimo de tonto, no hablas bien, etcétera. Para probar esta aseveración, se llevó a cabo un estudio con una muestra de nueve estudiantes que se distribuyeron en comunidades del sureste, con el propósito de que convivieran en estas comunidades. Antes de irse, se les aplicó una escala de actitudes hacia la discriminación indígena, misma que se les aplicó cuando regresaron.
Paso 1. Hipótesis.
Ho. No existen diferencias significativas en las actitudes hacia la dis- criminación de los indígenas, antes y después de convivir en comunidades indígenas.
H1. Si existen diferencias en las actitudes hacia la discriminación de los indígenas, antes y después de convivir en comunidades indígenas.
Paso 2. Nivel de significancia utilizado p = .05. Paso 3. Obtención de las calificaciones.
Antes Después
118
100
100
90
120
38
141
60
51
171
170
64
179
89
47
52
161
101
N =9
N =9
Pruebas de la estadística no paramétrica 101Pasos 4 y 5. Se obtienen las diferencias de las calificaciones antes-des- pués, por ejemplo, 118 - 100 = 18. Se ordenan los rangos de menor a mayor, el rango 1 es para la diferencia más pequeña, que en este caso es -5. Como la diferencia es negativa, el rango también será negativo.
Paso 6. Se obtiene la suma de rangos positivos y negativos. ∑R+ = 3 + 2 + 6 + 5 + 8 + 7 + 4 ∑R+ = 35
∑R- = -9 - 1 ∑R- = -10
Paso 7. Se elige el valor más pequeño resultado de la suma de rangos positivos y negativos. En este ejercicio el valor menor lo tiene la suma de rangos negativos, convirtiéndose en el valor tw.
tw = -10 Paso 8. Regla de decisión.
t we≤ t wt
se acepta la Ho. Antes Después d Rd118
100
18
3
100
90
10
2
120
38
82
6
141
60
81
5
51
171
-120
-9
170
64
106
8
179
89
90
7
4752
-5
-1
161
101
60
4
Sofía Rivera Aragón Mirna García Méndez 102
donde:
t we = El valor obtenido con el desarrollo de la fórmula (-10).
t wt = Es el valor en tablas, que en este caso se busca en la tabla B del apéndice, siguiendo el procedimiento descrito en chi cuadrada y McNemar. El resultado es 6.
10 > 6
se rechaza la H1.Interpretación de resultados
Estos resultados indican que no existen diferencias respecto a las actitudes hacia la discriminación de los indígenas antes y después de haber convivido con ellos.
Ejercicio
SPSSPara este ejercicio se retomarán los datos del Instituto Nacional Indigenista. Paso 1. Se coloca el cursor en Analyze y se da clic en el botón izquierdo del mouse.
Pruebas de la estadística no paramétrica 103
Paso 2. Al hacer clic en Analyze, aparece un menú en el que se coloca el cursor en Nonparametric tests, se da clic y aparece otro menú, se coloca el cursor en 2 Related Samples y se da clic.
Paso 3. Al hacer clic en 2 Related Samples, se abre un menú que contiene las variables de estudio. En este menú se da clic en el cuadro de Wilcoxon.
Sofía Rivera Aragón
Paso 4. Se coloca el cursor en la variable antes y se da clic en el icono que está entre las variables de estudio y Test Pair(s) List, antes aparece en variable 1, se sigue el mismo procedimiento con la variable después e igual aparece en variable 2.
Paso 5. Se da clic en el icono que está entre las variables de estudio y Test Pair(s) List, las variables antes después aparecen en Test Pair(s) List y se eliminan de variable 1 y variable 2.
Pruebas de la estadística no paramétrica 105
Interpretación de resultados
De acuerdo con los resultados, no se encontraron diferencias significativas en la actitud hacia la discriminación de los indígenas antes y después de haber convivido con ellos en sus comunidades.
Pruebas para muestras independientes
Los métodos no paramétricos de análisis de varianza dependen del ordenamiento de rangos. Las pruebas empleadas en este rubro son: U de Mann Whitney y