Business risks - 16 % Market Data +

Risk report

16 % Market Data +

3. Business risks

ESTADISTICA ANADISTICA ANALITICAALITICA

Capítulo II

Indice

COMPROBACION DE HIPOTESIS

Concepto estadístico de hipótesis

Una hipótesis es una idea que construimos a partir de un marco de conocimiento (¿produce un medicamento más curaciones que otro?). Para evaluar la verosimilitud de esta idea desde una perspectiva estadística, lo que hacemos es determinar la denominada Hipótesis nula (H0 - no hay diferencias entre ambos medicamentos), y la Hipótesis alternativa (H1 - los medicamentos se comportan de forma diferente). La verosimilitud de que la hipótesis nula no sea verdadera, se evalúa deci- diendo si las diferencias en el número de curaciones entre las muestras de pacientes tratados con los dos fármacos son ex- plicables por la variabilidad del muestreo. Si las diferencias encontradas no parecen ser debidas la azar, se rechaza la hi- pótesis nula y se acepta la alternativa. No rechazar la hipóte- sis nula no supone que los tratamientos sean iguales, única- mente supone que con el número de pacientes incluidos no so-

mos capaces de encontrar diferencias, lo que puede deberse a: que el número de pacientes incluidos es pequeño, o que la diferencia entre ambos tratamientos es pequeña, pero real. De forma arbitraria se acepta como probabilidad baja aquella que es inferior al 5%, es decir, siendo la hipótesis nula cierta, la rechazaríamos en 5 ocasiones de cada 100.

Las pruebas de contraste de hipótesis pueden ser (fig. 3):

Bilaterales

La hipótesis alternativa es que las muestras son diferentes (los medicamentos se comportan de forma diferente - es el medicamento A mejor que el B, o el medicamento B mejor que el A-).

Unilaterales

La hipótesis alternativa es que una de las muestras es supe- rior a la otra (el medicamento A es mejor que el B), careciendo de importancia para el investigador la otra posibilidad.

133

En general, se suelen utilizar pruebas bilaterales, ya que la hipótesis unilateral tiene interés únicamente en pocas situa- ciones.

Tipos de pruebas de hipótesis

Pruebas de conformidad

Verifican hipótesis sobre la forma de distribución (bondad de

134

E

STADISTICA ANALITICA Prueba unilateral* Ho: µ0 ≤µ Ha: µ0 > µ α = 0,05 0 Z = 1 645 Prueba bilateral** Ho µo = µ Ha µo ≠µ α/2 = 0,025 Ζ = 1,96

El aumento del tamaño muestral disminuye el error B e incrementa la potencia

Representación del riesgo β. Efecto del tamaño de muestra sobre el valor del riesgo β.

0 α/2 = 0,025 α/2 α/2 β β p p H0 H0 H0 H1 Ζ = −1,96

ajuste), o evalúan si un determinado valor muestral puede ajus- tarse a una parámetro poblacional. Una de las pruebas de bondad de ajuste más utilizada es la de Kolmogorov-Smirnov, que evalúa si una distribución se ajusta a la distribución normal.

Pruebas de relación/independencia

Evalúa la existencia de dependencia entre variables.

Pruebas de homogeneidad

Verifican si dos o más muestras provienen de la misma po- blación.

Las diferencias entre pruebas de homogeneidad y las de re- lación son sutiles, y a veces puede ser difícil diferenciarlas.

Tipos de errores

Al realizar una prueba de contraste de hipótesis se toma una decisión de rechazo/no rechazo de la hipótesis nula, basándose en estimaciones obtenidas a partir de muestras. Sin embargo, la realidad en las poblaciones de las que se obtienen las muestras puede no coindicidir con lo decidido (tabla I, fig. 3).

La posibilidad de que en nuestro estudio concluyamos que los tratamientos son diferentes, cuando la realidad no es así (aceptar H1 cuando la realidad es H0), recibe el nombre de error tipo I (error alfa, error de 1.a_{especie), y corresponde con}

lo que suele denominarse valor de la p de la prueba estadística utilizada (puede calcularse). Cuanto mayor número de pruebas de hipótesis realicemos, más facil es cometer un error tipo I. La posibilidad de que en nuestro estudio concluyamos que los tratamientos son iguales cuando la realidad es que son diferentes (aceptar H0 cuando la realidad es H1) recibe el nombre de error tipo II (error beta, error de 2.a_{especie ). Este último ti-}

po de error no es directamente calculable, ya que requiere determinar a partir de qué tamaño de diferencia consideraría- mos realmente distintas las posibilidades. Para cada magnitud de la diferencia tendremos un valor distinto de error tipo II. La probabilidad complementaria del error tipo II (1-error tipo II) recibe el nombre de potencia, y es la probabilidad de detectar diferencias entre los tratamientos en nuestro estudio cuando en la realidad estas diferencias existen (aceptar H1 cuando la realidad es H1).

PRUEBAS PARAMÉTRICAS Y NO PARAMETRICAS

Muchos de los procedimientos estadísticos más utilizados —métodos paramétricos— requieren que las variables a las que se aplican sigan algún modelo de distribución (habitual- mente la normal). Sin embargo, en medicina, con frecuencia trabajamos con variables que no cumplen el requisito de normalidad, o sobre las que no sabemos claramente si lo hacen (con pequeños tamaños muestrales - n < 10 - es muy difícil que pueda descartarse la normalidad, incluso en variables que no se ajustan claramente a esta distribución). En ocasiones, pode-

135

3

BIOESTADISTICA

El error alfa indica:

1. La posibilidad de aceptar la hipótesis nula cuando la hipótesis alternativa es cierta.

2. La posibilidad de rechazar la hipótesis nula cuando la hipótesis alternativa es cierta.

3. La posibilidad de aceptar la hipótesis alternativa cuando la hipó- tesis nula es cierta.

4. La posibilidad de aceptar la hipótesis alternativa cuando la hipó- tesis nula es falsa.

5. La posibilidad de rechazar la hipótesis alternativa cuando la hipó- tesis nula es falsa.

¿Cuál de las siguientes afirmaciones es verdadera?:

1. Las pruebas no paramétricas se utilizan con variables que tienen distribuciones normales.

2. La prueba de Kolmogorov-Smirnov se utiliza para evaluar si la distribución de una variable se ajusta a la normalidad.

3. En las muestras pequeñas siempre deben utilizarse pruebas para- métricas.

4. Cuando una variable no sigue la distribución normal no puede analizarse.

5. Los resultados de las pruebas paramétricas y no paramétricas son siempre similares.

Ha recogido usted información sobre la motalidad a los 30 días en 16 pacientes con intoxicación por setas. La mitad de los enfermos fueron tratados de forma habitual, y la otra mitad con un nuevo medicamen- to. De los 8 que recibieron el tratamiento habitual 7 murieron y de los 8 que en los que se utilizó el medicamento nuevo solamente murió 1. ¿Qué prueba utilizaría para descartar que estas diferencias puedan ser debidas a la casualidad?:

1. La prueba de Ji-Cuadrado con la corrección de Yates para muestras pequeñas.

2. La prueba exacta de Fisher.

3. Un análisis de supervivencia mediante la técnica de Kaplam- Meier.

4. La prueba de la t de Student. 5. Un análisis de la varianza.

Las pruebas no paramétricas:

1. Unicamente se utilizan para comparar distribuciones de variables continuas.

2. Requieren la comprobación del requisito de normalidad. 3. Originan unos valores de error alfa similares a los que se calculan

mediante pruebas paramétricas.

4. Deben utilizarse siempre que manejemos muestras de gran tamaño. 5. No realizan asunciones sobre el tipo de distribución de la varia-

ble. RESPUESTAS: 16: 3; 17: 2; 18: 2 ; 19:5. 17 18 19

mos realizar transformaciones de las variables originales (loga- ritmo, raíz cuadrada, etc.) que normalicen la variable; sin embargo, con frecuencia resulta útil usar otras técnicas estadísti- cas llamadas no paramétricas (libres de distribución). En ellas la violación del supuesto de normalidad no afecta al resultado. Estas pruebas no utilizan los valores de la variable, sino que utilizan el orden de la distribución de sus valores. Por ello, pueden utilizarse con variables continuas, discretas y cualitativas ordinales.

CONTRASTES DE HIPOTESIS BIVARIANTES

La existencia de distintas pruebas de hipótesis depende principalmente del tipo de variables incluidas. En la tabla II puede verse cuáles serían las técnicas más frecuentemente utilizadas.

Muchas de estas pruebas pueden realizarse para dos tipos de datos, los datos apareados y los datos independientes. En las pruebas de datos independientes la información proviene de grupos diferentes de individuos (comparar la tensión arterial en un grupo de jóvenes frente a un grupo de ancianos); por el contrario, en los pruebas para datos apareados la informa- ción proviene con mucha frecuencia de determinar la misma medición en el mismo individuo en momentos distintos (medir la tensión arterial en un grupo de personas jóvenes, esperar a que se hagan ancianos y repetir la medición). Los dos ejemplos propuestos intentarían contestar la misma duda (¿son diferentes las tensiones arteriales de los jóvenes que las de los ancianos?); sin embargo, el diseño apareado requeriría menos individuos, ya que la variabilidad de la tensión arterial dependien- te del individuo se reduce. El ejemplo más claro de datos apareados es el de la repetición de la medida en el mismo individuo, pero en algunos otros diseños también requieren la utili- zación de estas pruebas (estudios de gemelos, cuando los casos se aparean por variables importantes, etc.).

CONTRASTES VARIABLE CATEGORICA/CATEGORICA

La cuestión que se intenta resolver es si la distribución de los valores de cada variable se hace homogéneamente entre los valores de la otra, o si por el contrario, cuando una variable tiene un valor en un individuo es más probable que tenga un valor determinado en la otra. Por ejemplo, si estamos compa- rando dos medicamentos hipoglucemiantes, podemos valorar cuántos pacientes normalizan sus cifras de glucemia con cada uno de los medicamentos (tabla III).

Esta forma de presentar la información recibe el nombre de tabla de contingencia. El número de casos en cada casilla se denomina efectivos observados. El número de casos que ha- bría si la distribución fuese homogénea recibe el nombre de efectivos esperados.

El método de contestar estas preguntas depende del núme- ro de categorías de las variables y de los efectivos esperados en cada una de las casillas de la tabla de contingencia, y de si se trata de datos independientes o apareados.

Si se trata de tablas de contingencia de 2 X2 (dos variables dicotómicas) la hipótesis nula puede contrastarse mediante la prueba exacta de Fisher. Esta prueba consiste en calcular exactamente la probabilidad de que aparezcan distribuciones tan o más extremas (más heterogéneas) que la encontrada. Si los efectivos esperados en cada casilla de la tabla excede a 5 los resultados de la prueba de Fisher son muy similares a los obtenidos con la prueba de Ji-Cuadrado.

Si se trata de tablas con dimensiones superiores a 2 X2, el contraste de la hipótesis nula se realiza calculando la Ji-Cua- drado de la tabla de contingencia. El valor obtenido se compa- ra con el existente en las tablas de esta distribución, lo que nos indica su probabilidad. El número de grados de libertad que deben aplicarse es de: (número de filas-1) * (número de columnas-1), es decir, se multiplican el número de categorías

136

E

STADISTICA ANALITICA

TABLA I

In document Corporate report 2013 (Page 156-174)