• No results found

3.2 Introducción a la probabilidad

En esta sección presentaremos el lenguaje de la probabilidad y su interpretación.

Conceptos básicos

Una probabilidad es una cantidad numérica que expresa la verosimilitud de un suceso. La probabilidad de un sucesoE se expresa como

Pr{E}

Solo tiene significado hablar de una probabilidad Pr{E} en el contexto de una operación aleatoria; es decir, una ope- ración cuyo resultado está determinado al menos parcialmente por el azar. La operación aleatoria se puede definir de forma quecada vez que dicha operación aleatoria se realiza, el suceso E ocurre o no ocurre. Los dos ejemplos siguientes ilustran estas ideas.

Ejemplo 3.2.1 Lanzamiento de una moneda

Consideremos la operación aleatoria familiar de lanzar una moneda, y definamos el suceso:

E: salir cara

Cada vez que se lance la moneda, o sale cara o no. Si la moneda es tal que es igualmente probable que salgan caras o cruces, entonces

Pr{E} %1 2%0,5

Esta moneda ideal se denomina moneda «justa». Si la moneda no es justa (quizá porque esté ligeramente doblada), entonces Pr{E} puede tener un valor distinto de 0,5, por ejemplo,

Pr{E} % 0,6 %

Ejemplo 3.2.2 Lanzamiento de una moneda

Consideremos el suceso:

E: tres caras seguidas

La operación aleatoria «lanzar una moneda»no es adecuada para este suceso, ya que no podemos averiguar con un solo lanzamiento siE ha ocurrido. Una operación aleatoria que sería adecuada es

Operación aleatoria: Lanzar una moneda tres veces.

Otra operación aleatoria que sería adecuada es

Operación aleatoria: Lanzar una moneda 100 veces

entendiéndose queE ocurre si salen tres caras seguidas en cualquier momento de los 100 lanzamientos. La intuición sugiere queE sería más probable en la segunda definición de la operación aleatoria (100 lanzamientos) que en la primera (3 lanzamientos). Esta intuición es correcta y sirve para subrayar la importancia de la operación aleatoria en

la interpretación de una probabilidad. %

El lenguaje de la probabilidad se puede utilizar para describir los resultados del muestreo aleatorio de una población. La aplicación más sencilla de esta idea es un muestreo de tamañon % 1. Es decir, elegir aleatoriamente un miembro de una población. Se presenta a continuación un ejemplo de esta idea.

Ejemplo 3.2.3 Muestreo de moscas de la fruta

Se mantiene en un laboratorio una población grande de la mosca de la frutaDrosophila melanogaster. El 30 % de los individuos son negros debido a una mutación. Mientras que el 70 % restante tienen el color de cuerpo gris normal. Supongamos que se escogen aleatoriamente una mosca de la población. Entonces la probabilidad de que se escoja una mosca negra es 0,3. Más formalmente, si definimos

E: la mosca muestreada es negra

Entonces

Pr{E} % 0,3 % El ejemplo anterior ilustra la relación básica entre probabilidad y muestreo aleatorio:la probabilidad de que un indi- viduo escogido aleatoriamente tenga una cierta característica es igual a la proporción de los miembros de la población

con dicha característica.

Interpretación de la probabilidad como frecuencia

La interpretación de laprobabilidad como frecuencia proporciona una conexión entre la probabilidad y el mundo real, relacionando la probabilidad de un suceso con una cantidad medible, concretamente, la frecuencia relativa de inci- dencia a largo plazo del suceso*.

De acuerdo con la interpretación como frecuencia, la probabilidad de un sucesoE tiene significado solo en relación con una operación aleatoria que en principio se repite indefinidamente. Cada vez que se repite la operación aleatoria, el sucesoE ocurre o no ocurre. La probabilidad Pr{E} se interpreta como la frecuencia relativa de ocurrencias de E en una

serie infinitamente larga de repeticiones de la operación aleatoria.

Concretamente, supongamos que la operación aleatoria se repite un gran número de veces, y que en cada repetición se anota la incidencia o no incidencia deE. Entonces podemos expresar

Pr{E} T Ⲇ de veces que ocurre E

Ⲇ de veces que se repite la operación aleatoria

La flecha de la expresión anterior indica «igualdad aproximada a largo plazo». Es decir, si la operación aleatoria se repitiera muchas veces, los dos miembros de la expresión serían aproximadamente iguales. Presentamos a continuación un ejemplo sencillo.

Ejemplo 3.2.4 Lanzamiento de una moneda

Consideremos de nuevo la operación aleatoria de lanzar una moneda, y el suceso

E: salir cara

Si la moneda es justa, entonces

Pr{E} % 0,5 T Ⲇ de caras Ⲇ de cruces

La flecha en la expresión anterior indica que, en una larga serie de lanzamientos de una moneda justa, podemos

esperar obtener cara aproximadamente el 50 % de las veces. %

Los dos ejemplos siguientes ilustran la interpretación de frecuencias relativas en sucesos más complejos.

Ejemplo 3.2.5 Lanzamiento de una moneda

Supongamos que se lanza dos veces una moneda justa. Por razones que se explicará más adelante en esta sec- ción, la probabilidad de obtener cara las dos veces es 0,25. Esta probabilidad tiene la siguiente interpretación de frecuencia relativa

Operación aleatoria: lanzar dos veces una moneda

E: en ambos lanzamientos sale cara

Pr{E} % 0,25 T Ⲇ de veces que sale cara las dos veces Ⲇ de veces que se lanzan las dos monedas

Ejemplo 3.2.6 Muestreo de moscas de la fruta

En la poblaciónDrosophila del Ejemplo 3.2.3, el 30 % de las moscas son negras y el 70 % son grises. Suponga- mos que se escogen aleatoriamente dos moscas de la población. Veremos más adelante en esta sección que la proba- bilidad de que ambas moscas tengan el mismo color es de 0,58. Esta probabilidad se puede interpretar de la siguiente forma:

Operación aleatoria: elegir una muestra aleatoria de tamaño n % 2

E: las dos moscas de la muestra son del mismo color

Pr{E} % 0,58 T Ⲇ de veces que ambas moscas son del mismo color Ⲇ de veces que se elige una muestra de tamaño n % 2

* Algunos estadísticos prefieren una perspectiva diferente, concretamente que la probabilidad de un suceso es una cantidad subjetiva que expresa el «grado de confianza» en que un suceso ocurrirá. Los métodos estadísticos basados en esta interpretación «subjetivista» son algo diferentes a los presentados en este libro.

Podemos relacionar esta interpretación con un experimento de muestreo concreto. Supongamos que la población deDrosophila está en un contenedor muy grande, y que tenemos algún mecanismo que permite escoger aleatoria- mente una mosca del contenedor. Escogemos una mosca aleatoriamente y después otra. Estas dos moscas consti- tuyen la primera muestra den % 2. Tras apuntar sus colores, volvemos a poner las dos moscas en el contenedor, y estamos listos para repetir la operación de muestreo de nuevo otra vez. Este experimento de muestreo sería tedioso de realizar físicamente, pero se puede simular fácilmente utilizando un computador. La Tabla 3.2.1 muestra un re- gistro parcial de los resultados de escoger 10.000 muestras aleatorias de tamañon % 2 de una población simulada de

Drosophila. Tras cada repetición de la operación aleatoria (es decir, tras cada muestra de n % 2), se actualiza la

frecuencia relativa del sucesoE, como se indica en la columna de la tabla que está más a la derecha.

Tabla 3.2.1 Resultados parciales de muestreo aleatorio de una población de Drosophila

Número de muestra

Color

Primera mosca Segunda mosca ¿OcurrióE?

Frecuencia relativa deE (acumulativa) 1 G B No 0,000 2 B B Sí 0,500 3 B G No 0,333 4 G B No 0,250 5 G G Sí 0,400 6 G B No 0,333 7 B B Sí 0,429 8 G G Sí 0,500 9 G B No 0,444 10 B B Sí 0,500 . . . . . . . . . . . . . . . 20 G B No 0,450 . . . . . . . . . . . . . . . 100 G B No 0,540 . . . . . . . . . . . . . . . 1.000 G G Sí 0,596 . . . . . . . . . . . . . . . 10.000 B B Sí 0,577

La Figura 3.2.1 muestra la frecuencia relativa actualizada en función del número de muestras. Nótese que, cuan- do el número de muestras se hace grande, la frecuencia relativa de incidencias deE se acerca a 0,58 (que es Pr{E}). En otras palabras, el porcentaje de muestras de color homogéneo en todas las muestras se acerca al 58 % a medida que el número de muestras aumenta. Sin embargo, debe resaltarse que el númeroabsoluto de muestras de color homogéneo generalmente no tiende a acercarse al 58 % del número total. Por ejemplo, si comparamos los 3.2 Introducción a la probabilidad 87

(b) Muestras 100 a 10.000 0,62 0,58 Frecuencia relati v a de E 0,54 0 2.000 4.000 Número de muestra 6.000 8.000 10.000 Pr{E} 1,0 0,8 0,6 0,4 0,2 0 0 20 40 60 Número de muestra (a) Primeras 100 muestras

80 100 Frecuencia relati v a de E Pr{E}

Figura 3.2.1 Resultados del muestreo de la población de mosca de la fruta. Nótese que en (a) y (b)

la escala de los ejes es diferente

resultados que se muestran en la Tabla 3.2.1 para las primeras 100 muestras y para las primeras 1.000 muestras, encontramos lo siguiente: De color homogéneo Desviación del 58 % o del total Primeras 100 muestras: 54 o 54 % .4 o .4 % Primeras 1.000 muestras: 596 o 59,6 % !16 o !1,6 %

Nótese que la desviación del 58 % es mayor en términos absolutos, pero menor en términos relativos (es decir, en términos de porcentajes), para 1.000 muestras que para 100 muestras. Asimismo, para 10.000 muestras la desviación del 58 % es aún mayor (una desviación de .30), pero la desviación en porcentaje es muy pequeña (30/10.000 es 0,3 %). El déficit de cuatro muestras de color homogéneo en las 100 primeras muestras no se cancela por un corres- pondiente exceso en muestras posteriores, sino que es reducido al dividir la frecuencia de aparición por un denomi-

Árboles de probabilidad

A menudo es útil utilizar unárbol de probabilidad para analizar un problema de probabilidades. Un árbol de proba- bilidad proporciona una forma adecuada de dividir un problema en partes y organizar la información disponible. Los siguientes ejemplos muestran algunas aplicaciones de esta idea.

Ejemplo 3.2.7 Lanzamiento de una moneda

Si se lanza dos veces una moneda justa, entonces la probabilidad de obtener cara es 0,5 en cada lanzamiento. La primera parte de un árbol de probabilidad en este escenario muestra que hay dos posibles resultados del primer lanzamiento y que cada uno de ellos tiene una probabilidad de 0,5.

0,5

0,5

Cara

Cruz

Después el árbol muestra que, para cada resultado del primer lanzamiento, el segundo lanzamiento también puede ser cara o cruz, de nuevo con probabilidad 0,5 en cada caso.

0,5 0,5 Cara Cruz 0,5 0,5 Cara Cruz 0,5 0,5 Cara Cruz

Para obtener la probabilidad de obtener cara en ambos lanzamientos, consideraremos el camino por el árbol que produce este suceso. Multiplicaremos entre sí las probabilidades que encontramos a lo largo de ese camino. La Figu- ra 3.2.2 resume este ejemplo y muestra que

Pr{cara en ambos lanzamientos} % 0,5 # 0,5 % 0,25 %

0,5 0,5 Cara Cruz 0,5 0,5 Cara Cruz Cara, cruz Cruz, cara Cruz, cruz Cara, cara 0,25 Suceso Probabilidad 0,25 0,25 0,25 0,5 0,5 Cara Cruz

Figura 3.2.2 Árbol de probabilidad del lanzamiento de dos monedas

Combinación de probabilidades

Si un suceso puede ocurrir en más de una forma, la interpretación de frecuencia relativa de la probabilidad puede ser una guía para combinar apropiadamente las probabilidades de los subsucesos. El siguiente ejemplo ilustra esta idea.

Ejemplo 3.2.8 Muestreo de mosca de la fruta

En los Ejemplos 3.2.3 y 3.2.6 de la población deDrosophila, el 30 % de las moscas son negras y el 70 % son grises. Supongamos que se escogen aleatoriamente dos moscas de la población. Supongamos además que deseamos obtener la probabilidad de que ambas moscas sean del mismo color. El árbol de probabilidad que se muestra en la Figura 3.2.3 indica los cuatro posibles resultados de tomar una muestra de dos moscas. Observando el árbol, pode- mos ver que la probabilidad de obtener dos moscas negras es 0,3 # 0,3 % 0,09. Asimismo, la probabilidad de obte- ner dos moscas grises es 0,7 # 0,7 % 0,49.

Para obtener la probabilidad del suceso

E: ambas moscas en la muestra son del mismo color

sumamos la probabilidad de negro, negro a la probabilidad de gris, gris y obtenemos 0,09 ! 0,49 % 0,58. % En el experimento de lanzamiento de moneda del Ejemplo 3.2.7, la segunda parte del árbol de probabilidad tenía la misma estructura que la primera parte (una probabilidad de 0,5 de obtener cara y una probabilidad de 0,5 de obtener cruz), ya que el resultado del primer lanzamiento no afecta a la probabilidad de obtener cara en el segundo lanzamiento. Asimismo, en el Ejemplo 3.2.8, la probabilidad de que la segunda mosca sea negra era de 0,3, independientemente del color de la primera mosca, porque la población se suponía muy grande, de manera que extraer una mosca de la población no afecta a la proporción de moscas que son negras. Sin embargo, en algunas situaciones es necesario tratar la segunda parte del árbol de probabilidad de forma diferente que la primera parte.

Ejemplo 3.2.9 Óxido nítrico

El fallo respiratorio por hipoxia es una situación seria que afecta a algunos recién nacidos. Si un recién nacido está en esta situación, a menudo es necesario utilizar oxigenación mediante membrana extracorpórea (ECMO) para

0.3 0,7 Negro Gris 0.3 0,7 Negro Gris Negro, gris Gris, negro Gris, gris Negro, negro 0,09 Suceso Probabilidad 0,21 0,21 0,49 0,3 0,7 0,3 Negro Gris 0,3 Negro Gris Negro Gris Negro Gris

Figura 3.2.3 Árbol de probabilidad del muestreo de dos moscas

salvar la vida del niño. Sin embargo, la ECMO es un procedimiento invasivo en el que se inserta un tubo en una vena o arteria cerca del corazón, por lo que los médicos intentan evitar su necesidad. Un tratamiento del fallo respi- ratorio hipóxico es hacer que el recién nacido inhale óxido nítrico. Para probar la efectividad este tratamiento, se asignaron aleatoriamente recién nacidos que sufrían fallo respiratorio hipóxico a un grupo que recibía óxido nítrico o a un grupo de control1. En el grupo de tratamiento, el 45,6 % de los recién nacidos tuvieron un resultado negativo, lo que significa que o bien necesitaron ECMO o fallecieron. En el grupo de control, el 63,6 % de los recién nacidos tuvieron un resultado negativo. La Figura 3.2.4 muestra el árbol de probabilidad de este experimento.

0,544 0,456 Positivo Negativo 0,364 0,636 Positivo Negativo 0,228 0,182 0,318 0,272 Probabilidad Resultado 0,5 0,5 Tratamiento Control

Figura 3.2.4 Árbol de probabilidad del ejemplo del óxido nítrico

Si seleccionamos de forma aleatoria un recién nacido de este grupo, hay una probabilidad de 0,5 de que el recién nacido esté en el grupo de tratamiento y, si es así, una probabilidad de 0,456 de obtener un resultado negativo. Asimismo, hay una probabilidad de 0,5 de que el recién nacido esté en el grupo de control y, si es así, una probabili- dad de 0,636 de obtener un resultado negativo. Por tanto, la probabilidad de un resultado negativo es

0,5 # 0,456 ! 0,5 # 0,636 % 0,228 ! 0,318 % 0,546 %

Ejemplo 3.2.10 Prueba médica

Supongamos que se realiza una prueba médica en una persona para intentar determinar si dicha persona tiene o no tiene una enfermedad en particular. Si la prueba indica que la enfermedad está presente, se dice que dicha perso- na tiene un «resultado positivo». Si la prueba indica que la enfermedad no está presente, se dice que dicha persona tiene un «resultado negativo». Sin embargo, hay dos tipos de errores que se pueden cometer. Es posible que la prueba indique que la enfermedad está presente, pero que la persona realmente no tenga la enfermedad; esto se conoce como falso positivo. También es posible que la persona tenga la enfermedad, pero que la prueba no la detec- te. Esto se conoce como falso negativo.

Supongamos que una prueba concreta tiene un 95 % de probabilidades de detectar la enfermedad si la persona la tiene (esto se denomina sensibilidad de la prueba), y el 90 % de probabilidades de indicar correctamente que la enfermedad está ausente si la persona realmente no tiene dicha enfermedad (esto se denomina especificidad de la prueba). Supongamos que el 8 % de la población tiene la enfermedad. ¿Cuál es la probabilidad de que una persona escogida aleatoriamente dé un resultado positivo?

La Figura 3.2.5 muestra un árbol de probabilidad de esta situación. La primera bifurcación del árbol muestra la división entre aquellos que tienen la enfermedad y aquellos que no la tienen. Si alguien tiene la enfermedad, enton- ces utilizamos el 95 % de la probabilidad de que la persona dé un resultado positivo. Si la persona no tiene la enfermedad, en todos utilizamos el 0,10 de la probabilidad de que la persona dé un resultado positivo. Por tanto, la probabilidad de que una persona escogida aleatoriamente dé un resultado positivo es

0,08 # 0,95 ! 0,92 # 0,10 % 0,076 ! 0,092 % 0,168 % 0,95 0,05 Test positivo Test negativo 0,1 0,9 Test positivo Test negativo Falso negativo Falso positivo Negativo verdadero Positivo verdadero 0,076 Suceso Probabilidad 0,004 0,092 0,828 0,08 0,92 Tiene una enfermedad No tiene una enfermedad

Ejemplo 3.2.11 Falsos positivos

Consideremos el escenario de la prueba médica del Ejemplo 3.2.10. Si el resultado de la prueba sobre alguien es positivo, ¿cuál es la probabilidad de que la persona realmente tenga la enfermedad? En el Ejemplo 3.2.10 obtuvimos que 0,168 (el 16,8 %) de la población tendría un resultado de la prueba positivo, de forma que si se realizara la prueba a 1.000 personas, se podría esperar que 168 tuvieran un resultado positivo. La probabilidad de un positivo verdadero es de 0,076, por lo que se podría esperar 76 «positivos verdaderos» en las 1.000 personas sobre las que se realizara la prueba. Por tanto, se pueden esperar 76 verdaderos positivos de 168 positivos en total, es decir que la probabilidad de que alguien realmente tenga la enfermedad, dado que el resultado de la prueba sobre dicha persona es positivo, es 76

168% 0,076

0,168]0,452. Esta probabilidad es un tanto pequeña respecto a la que la mayoría de la gente esperaría obtener, dado que la sensibilidad y la especificidad del texto son de 0,95 y 0,90. %

Ejercicios 3.2.1-3.2.7

3.2.1 En una cierta población de cabezas gordas de agua

dulce,Cottus rotheus, la distribución del número de vérte-

bras en la cola se muestra en la tabla2.

Número de vértebras Porcentaje de peces 20 3 21 51 22 40 23 6 Total 100

Calcule la probabilidad de que el número de vértebras en la cola de un pez escogido aleatoriamente de la población (a) sea igual a 21;

(b) sea menor o igual que 22; (c) sea mayor que 21; (d) no sea mayor que 21.

3.2.2 En una cierta universidad, el 55 % de los estudiantes son mujeres. Supongamos que tomamos una muestra de dos estudiantes. Utilice un árbol de probabilidad para obtener la probabilidad

(a) de que los dos estudiantes elegidos sean mujeres; (b) de que al menos uno de los dos estudiantes sea una mujer.

3.2.3 Suponga que una enfermedad se hereda de manera li- gada al sexo, de forma que la descendencia masculina tiene un 50 % de probabilidades de heredar la enfermedad, pero la descendencia femenina no tiene ninguna probabilidad de he- redar la enfermedad. Suponga además que el 51,3 % de los niños son varones. ¿Cuál es la probabilidad de que un niño escogido aleatoriamente esté afectado por la enfermedad?

3.2.4 Suponga que un estudiante que está a punto de reali- zar un test de múltiples respuestas solo ha aprendido el 40 % de la materia del examen. Por tanto, hay una probabilidad del 40 % de que sepa la respuesta a una pregunta. Sin em- bargo, incluso aunque no sepa la respuesta a una pregunta, tiene todavía una probabilidad del 20 % de obtener la res- puesta correcta adivinándola. Si se escoge aleatoriamente una pregunta del examen, ¿cuál es la probabilidad de que su respuesta sea correcta?

3.2.5 Si una mujer realiza una prueba de embarazo, puede obtener un resultado positivo, lo que significa que la prueba indica que está embarazada o un resultado negativo, lo que significa que la prueba dice que no está embarazada. Supon- gamos que si una mujer realmente está embarazada, hay un 98 % de probabilidades de que la prueba dé un resultado po-

sitivo. Supongamos también que si una mujer realmenteno

está embarazada, hay un 99 % de probabilidades de que la prueba dé un resultado negativo.

(a) Suponga que 1.000 mujeres realizan la prueba de emba- razo y que 100 de ellas realmente están embarazadas. ¿Cuál es la probabilidad de que una mujer escogida alea- toriamente de este grupo dé un resultado positivo? (b) Suponga que 1.000 mujeres realizan la prueba de emba-

razo y que 50 realmente están embarazadas. ¿Cuál es la probabilidad de que una mujer elegida aleatoriamente de este grupo dé un resultado positivo?

3.2.6

(a) Considere el experimento del Ejercicio 3.2.5, aparta- do (a). Suponga que el resultado de la mujer es positivo. ¿Cuál es la probabilidad de que realmente esté embara- zada?

(b) Considere el experimento del Ejercicio 3.2.5, aparta- do (b). Suponga que el resultado de la mujer es positivo.