6. PRUEBA EXACTA DE FISHER
La prueba exacta de Fisher es una prueba estadística utilizada en el análisis de datos categóricos (cualitativos) cuando el número de muestras (es decir, el tamaño de muestra) es pequeño. La prueba exacta de Fisher aplicada a cuadros de contingencia 2x2 es útil en los siguientes casos:
- las observaciones de un carácter se asignan a dos o más categorías (clases);
- la variación se deberá únicamente a la realización de muestreos aleatorios, esto es, no debería producirse variación debido a las condiciones del suelo, etcétera;
- los valores previstos en cada categoría son menores de diez.
6.1 Examen de la distinción
6.1.1 La prueba exacta de Fisher se utiliza para determinar si existen asociaciones no aleatorias entre dos variables categóricas en un cuadro de contingencia de 2 × 26 y puede utilizarse cuando el número de muestras correspondientes a una o más categorías para cada variedad es menor que 10 (véanse las celdas señaladas con marco grueso en el cuadro 1) o cuando el cuadro está muy desequilibrado. Si el número de muestras es mayor (es decir, 10 o más), suele ser preferible aplicar una prueba ji cuadrado.
6.1.2 Esta prueba sólo es para el análisis de datos en categorías. El método se ilustra mediante los ejemplos hipotéticos siguientes:
Ejemplo 1
6.1.3 En el siguiente ejemplo, la frecuencia de flores de color azul oscuro se utiliza como un carácter relevante en el ensayo DHE. En este ejemplo de ensayo DHE con dos variedades, las plantas se clasifican en función de si tienen o no flores de color azul oscuro.
6.1.4 Supongamos que se han observado diferencias en la proporción de flores de color azul oscuro entre las dos variedades (variedad 1 y variedad 2). Los examinadores necesitan poder determinar con confianza si estas diferencias pueden aceptarse como claramente distinguibles entre las variedades y la prueba exacta de Fisher es un método aceptado para contrastar la hipótesis de que las diferencias observadas son estadísticamente significativas. En el cuadro 1 se muestran datos hipotéticos de un total de 24 plantas.
Cuadro 1: Cuadro de contingencia de 2 × 2 del número de plantas con flores de color azul oscuro y de color distinto del azul oscuro observadas en las variedades 1 y 2
+ Variedad 1 Variedad 2 Total
Color distinto del azul oscuro 4 9 13
Color azul oscuro 8 3 11
Total 12 12 24
En un cuadro de contingencia de 2 × 2, el número de grados de libertad siempre es 1.
6
TGP/8/3: PARTE II: 6: PRUEBA EXACTA DE FISHER página 97
6.1.5 ¿Cuál es la probabilidad de que la variedad 1 sea distinta de la variedad 2, en lo que respecta a este carácter, sabiendo que 11 de estas 24 flores son de color azul oscuro y, de estas, 8 son de la variedad 1 y 3 de la variedad 2? O, en otras palabras, la diferencia observada en el color de las flores está asociada a las diferencias varietales, o es probable que sea fruto del azar en el muestreo? El método de Fisher calcula la probabilidad exacta de una asociación no aleatoria, de un cuadro de contingencia 2 × 2, usando una distribución hipergeométrica.7 En este caso, la probabilidad se calcula como la suma de las probabilidades para los posibles casos de que sea tan larga o más de lo observado. Así, además del observado, el número de flores azul oscuro que daría un resultado satisfactorio será de 9, 10 o 11 para la variedad 1 y de 2, 1 ó 0 para la variedad 2.
6.1.6 Representando los valores de las celdas anteriores en notación algebraica, se determina la fórmula general para calcular la probabilidad de los números observados (cuadro 2).
Cuadro 2: Notación algebraica para la prueba exacta de Fisher
Variedad 1 Variedad 2 Total
Color distinto del azul oscuro
a b a + b
Color azul oscuro c d c + d
Total a + c b + d n
p = (a +b)! (c+d)! (a+c)!(b+d)! n!a!b!c!d!
6.1.7 donde p es la probabilidad exacta de Fisher de encontrar una asociación no aleatoria entre las variedades y los caracteres. El símbolo “!” significa “factorial de”.
6.1.8 Sustituyendo las notaciones algebraicas del cuadro 2 por las cifras correspondientes a los valores observados del cuadro 1:
p = (13)! (11)! (12)!(12)! 24!4!9!8!3! Tras calcular los factoriales:
p = 0,05
6.1.9 La interpretación del valor de p calculado en la prueba exacta de Fisher es sencilla. En el ejemplo anterior, p = 0,05 significa que hay una probabilidad del 5% de que, con el tamaño de muestra y la distribución del cuadro 1, las diferencias observadas sean únicamente fruto del azar en el muestreo. Dado el pequeño tamaño de muestra y la necesidad de establecer una clara distinguibilidad entre las variedades, las autoridades examinadoras pueden elegir una p = 0,01 como umbral superior de nivel de significación para aceptar la hipótesis nula. Siendo esto así, una autoridad examinadora concluiría, en este ejemplo, que la diferencia observada en el carácter flores de color azul oscuro o de color distinto al azul oscuro no es estadísticamente significativa y las dos variedades (variedad 1 y variedad 2) no son distintas a este respecto.
Ejemplo 2
6.1.10 En el cuadro 3 se muestran los valores correspondientes a las mismas observaciones del mismo carácter en las variedades 3 y 4:
Cuadro 3: Número de plantas con flores de color azul oscuro y de color distinto del azul oscuro observadas en las variedades 3 y 4
Variedad 3 Variedad 4 Total
Color distinto del azul oscuro
1 9 10
Color azul oscuro 11 3 14
Total 12 12 24
7
Una distribución hipergeométrica es una distribución de probabilidad discreta que describe el número de sucesos en una secuencia de n extracciones de una población finita sin reemplazamiento.
TGP/8/3: PARTE II: 6: PRUEBA EXACTA DE FISHER página 98
Sustituyendo los valores anteriores en la fórmula de la distribución hipergeométrica de Fisher: p = (10!) (14!)(12)!(12)!
24!1!9!11!3!
Tras calcular los factoriales, obtenemos el valor de probabilidad de Fisher: p = 0,001
6.1.11 En este caso particular, la hipótesis nula (que las variedades son similares en lo que respecta al carácter flores de color azul oscuro o flores de color distinto al azul oscuro) se rechaza porque la probabilidad de Fisher calculada es mucho menor que el nivel de significación aceptable (p = 0,01). Por consiguiente, las dos variedades (variedad 3 y variedad 4) deben declararse distintas.
TGP/8/3: PARTE II: 7: SISTEMA DE COMPARACIÓN