Risk report
16 % Market Data +
3. Business risks
ESTADISTICA ANADISTICA ANALITICAALITICA
Capítulo II
Indice
COMPROBACION DE HIPOTESIS
Concepto estadístico de hipótesis
Una hipótesis es una idea que construimos a partir de un marco de conocimiento (¿produce un medicamento más cura- ciones que otro?). Para evaluar la verosimilitud de esta idea desde una perspectiva estadística, lo que hacemos es determi- nar la denominada Hipótesis nula (H0 - no hay diferencias en- tre ambos medicamentos), y la Hipótesis alternativa (H1 - los medicamentos se comportan de forma diferente). La verosimili- tud de que la hipótesis nula no sea verdadera, se evalúa deci- diendo si las diferencias en el número de curaciones entre las muestras de pacientes tratados con los dos fármacos son ex- plicables por la variabilidad del muestreo. Si las diferencias encontradas no parecen ser debidas la azar, se rechaza la hi- pótesis nula y se acepta la alternativa. No rechazar la hipóte- sis nula no supone que los tratamientos sean iguales, única- mente supone que con el número de pacientes incluidos no so-
mos capaces de encontrar diferencias, lo que puede deberse a: que el número de pacientes incluidos es pequeño, o que la di- ferencia entre ambos tratamientos es pequeña, pero real. De forma arbitraria se acepta como probabilidad baja aquella que es inferior al 5%, es decir, siendo la hipótesis nula cierta, la rechazaríamos en 5 ocasiones de cada 100.
Las pruebas de contraste de hipótesis pueden ser (fig. 3):
Bilaterales
La hipótesis alternativa es que las muestras son diferentes (los medicamentos se comportan de forma diferente - es el medicamento A mejor que el B, o el medicamento B mejor que el A-).
Unilaterales
La hipótesis alternativa es que una de las muestras es supe- rior a la otra (el medicamento A es mejor que el B), careciendo de importancia para el investigador la otra posibilidad.
133
En general, se suelen utilizar pruebas bilaterales, ya que la hipótesis unilateral tiene interés únicamente en pocas situa- ciones.
Tipos de pruebas de hipótesis
Pruebas de conformidad
Verifican hipótesis sobre la forma de distribución (bondad de
134
E
STADISTICA ANALITICA Prueba unilateral* Ho: µ0 ≤µ Ha: µ0 > µ α = 0,05 0 Z = 1 645 Prueba bilateral** Ho µo = µ Ha µo ≠µ α/2 = 0,025 Ζ = 1,96El aumento del tamaño muestral disminuye el error B e incrementa la potencia
Representación del riesgo β. Efecto del tamaño de muestra sobre el valor del riesgo β.
0 α/2 = 0,025 α/2 α/2 β β p p H0 H0 H0 H1 Ζ = −1,96
ajuste), o evalúan si un determinado valor muestral puede ajus- tarse a una parámetro poblacional. Una de las pruebas de bon- dad de ajuste más utilizada es la de Kolmogorov-Smirnov, que evalúa si una distribución se ajusta a la distribución normal.
Pruebas de relación/independencia
Evalúa la existencia de dependencia entre variables.
Pruebas de homogeneidad
Verifican si dos o más muestras provienen de la misma po- blación.
Las diferencias entre pruebas de homogeneidad y las de re- lación son sutiles, y a veces puede ser difícil diferenciarlas.
Tipos de errores
Al realizar una prueba de contraste de hipótesis se toma una decisión de rechazo/no rechazo de la hipótesis nula, basándose en estimaciones obtenidas a partir de muestras. Sin embargo, la realidad en las poblaciones de las que se obtienen las muestras puede no coindicidir con lo decidido (tabla I, fig. 3).
La posibilidad de que en nuestro estudio concluyamos que los tratamientos son diferentes, cuando la realidad no es así (aceptar H1 cuando la realidad es H0), recibe el nombre de error tipo I (error alfa, error de 1.aespecie), y corresponde con
lo que suele denominarse valor de la p de la prueba estadística utilizada (puede calcularse). Cuanto mayor número de pruebas de hipótesis realicemos, más facil es cometer un error tipo I. La posibilidad de que en nuestro estudio concluyamos que los tratamientos son iguales cuando la realidad es que son dife- rentes (aceptar H0 cuando la realidad es H1) recibe el nombre de error tipo II (error beta, error de 2.aespecie ). Este último ti-
po de error no es directamente calculable, ya que requiere de- terminar a partir de qué tamaño de diferencia consideraría- mos realmente distintas las posibilidades. Para cada magnitud de la diferencia tendremos un valor distinto de error tipo II. La probabilidad complementaria del error tipo II (1-error tipo II) re- cibe el nombre de potencia, y es la probabilidad de detectar di- ferencias entre los tratamientos en nuestro estudio cuando en la realidad estas diferencias existen (aceptar H1 cuando la rea- lidad es H1).
PRUEBAS PARAMÉTRICAS Y NO PARAMETRICAS
Muchos de los procedimientos estadísticos más utilizados —métodos paramétricos— requieren que las variables a las que se aplican sigan algún modelo de distribución (habitual- mente la normal). Sin embargo, en medicina, con frecuencia trabajamos con variables que no cumplen el requisito de nor- malidad, o sobre las que no sabemos claramente si lo hacen (con pequeños tamaños muestrales - n < 10 - es muy difícil que pueda descartarse la normalidad, incluso en variables que no se ajustan claramente a esta distribución). En ocasiones, pode-
135
3
BIOESTADISTICA
16
El error alfa indica:
1. La posibilidad de aceptar la hipótesis nula cuando la hipótesis al- ternativa es cierta.
2. La posibilidad de rechazar la hipótesis nula cuando la hipótesis alternativa es cierta.
3. La posibilidad de aceptar la hipótesis alternativa cuando la hipó- tesis nula es cierta.
4. La posibilidad de aceptar la hipótesis alternativa cuando la hipó- tesis nula es falsa.
5. La posibilidad de rechazar la hipótesis alternativa cuando la hipó- tesis nula es falsa.
¿Cuál de las siguientes afirmaciones es verdadera?:
1. Las pruebas no paramétricas se utilizan con variables que tienen distribuciones normales.
2. La prueba de Kolmogorov-Smirnov se utiliza para evaluar si la distribución de una variable se ajusta a la normalidad.
3. En las muestras pequeñas siempre deben utilizarse pruebas para- métricas.
4. Cuando una variable no sigue la distribución normal no puede analizarse.
5. Los resultados de las pruebas paramétricas y no paramétricas son siempre similares.
Ha recogido usted información sobre la motalidad a los 30 días en 16 pa- cientes con intoxicación por setas. La mitad de los enfermos fueron tratados de forma habitual, y la otra mitad con un nuevo medicamen- to. De los 8 que recibieron el tratamiento habitual 7 murieron y de los 8 que en los que se utilizó el medicamento nuevo solamente murió 1. ¿Qué prueba utilizaría para descartar que estas diferencias puedan ser debidas a la casualidad?:
1. La prueba de Ji-Cuadrado con la corrección de Yates para mues- tras pequeñas.
2. La prueba exacta de Fisher.
3. Un análisis de supervivencia mediante la técnica de Kaplam- Meier.
4. La prueba de la t de Student. 5. Un análisis de la varianza.
Las pruebas no paramétricas:
1. Unicamente se utilizan para comparar distribuciones de variables continuas.
2. Requieren la comprobación del requisito de normalidad. 3. Originan unos valores de error alfa similares a los que se calculan
mediante pruebas paramétricas.
4. Deben utilizarse siempre que manejemos muestras de gran tamaño. 5. No realizan asunciones sobre el tipo de distribución de la varia-
ble. RESPUESTAS: 16: 3; 17: 2; 18: 2 ; 19:5. 17 18 19
mos realizar transformaciones de las variables originales (loga- ritmo, raíz cuadrada, etc.) que normalicen la variable; sin em- bargo, con frecuencia resulta útil usar otras técnicas estadísti- cas llamadas no paramétricas (libres de distribución). En ellas la violación del supuesto de normalidad no afecta al resultado. Estas pruebas no utilizan los valores de la variable, sino que utilizan el orden de la distribución de sus valores. Por ello, pue- den utilizarse con variables continuas, discretas y cualitativas ordinales.
CONTRASTES DE HIPOTESIS BIVARIANTES
La existencia de distintas pruebas de hipótesis depende principalmente del tipo de variables incluidas. En la tabla II puede verse cuáles serían las técnicas más frecuentemente utilizadas.
Muchas de estas pruebas pueden realizarse para dos tipos de datos, los datos apareados y los datos independientes. En las pruebas de datos independientes la información proviene de grupos diferentes de individuos (comparar la tensión arte- rial en un grupo de jóvenes frente a un grupo de ancianos); por el contrario, en los pruebas para datos apareados la informa- ción proviene con mucha frecuencia de determinar la misma medición en el mismo individuo en momentos distintos (medir la tensión arterial en un grupo de personas jóvenes, esperar a que se hagan ancianos y repetir la medición). Los dos ejemplos propuestos intentarían contestar la misma duda (¿son diferen- tes las tensiones arteriales de los jóvenes que las de los ancia- nos?); sin embargo, el diseño apareado requeriría menos indi- viduos, ya que la variabilidad de la tensión arterial dependien- te del individuo se reduce. El ejemplo más claro de datos apa- reados es el de la repetición de la medida en el mismo indivi- duo, pero en algunos otros diseños también requieren la utili- zación de estas pruebas (estudios de gemelos, cuando los ca- sos se aparean por variables importantes, etc.).
CONTRASTES VARIABLE CATEGORICA/CATEGORICA
La cuestión que se intenta resolver es si la distribución de los valores de cada variable se hace homogéneamente entre los valores de la otra, o si por el contrario, cuando una variable tiene un valor en un individuo es más probable que tenga un valor determinado en la otra. Por ejemplo, si estamos compa- rando dos medicamentos hipoglucemiantes, podemos valorar cuántos pacientes normalizan sus cifras de glucemia con cada uno de los medicamentos (tabla III).
Esta forma de presentar la información recibe el nombre de tabla de contingencia. El número de casos en cada casilla se denomina efectivos observados. El número de casos que ha- bría si la distribución fuese homogénea recibe el nombre de efectivos esperados.
El método de contestar estas preguntas depende del núme- ro de categorías de las variables y de los efectivos esperados en cada una de las casillas de la tabla de contingencia, y de si se trata de datos independientes o apareados.
Si se trata de tablas de contingencia de 2 X2 (dos variables dicotómicas) la hipótesis nula puede contrastarse mediante la prueba exacta de Fisher. Esta prueba consiste en calcular exactamente la probabilidad de que aparezcan distribuciones tan o más extremas (más heterogéneas) que la encontrada. Si los efectivos esperados en cada casilla de la tabla excede a 5 los resultados de la prueba de Fisher son muy similares a los obtenidos con la prueba de Ji-Cuadrado.
Si se trata de tablas con dimensiones superiores a 2 X2, el contraste de la hipótesis nula se realiza calculando la Ji-Cua- drado de la tabla de contingencia. El valor obtenido se compa- ra con el existente en las tablas de esta distribución, lo que nos indica su probabilidad. El número de grados de libertad que deben aplicarse es de: (número de filas-1) * (número de columnas-1), es decir, se multiplican el número de categorías
136