• No results found

En las secciones anteriores hemos estudiado medidas de tendencia cen- tral (media, moda y mediana), y medidas de dispersión (varianza y desviación estándar). También estudiamos el grado de asimetría (sesgo) de una distribución y su curtosis (altura). Es decir, ya podemos describir, en términos generales, el comportamiento de un conjunto de valores que estemos estudiando.

Retomando el concepto de desviación estándar, diremos que una de las aplicaciones que tiene es que podemos utilizarlo para conocer apro-

ximadamente cuántas de las puntuaciones se agrupan en ciertos interva- los de la serie formados por la suma y la resta de una, dos o tres veces el valor de la desviación estándar con respecto al valor medio. Para esto es que estudiaremos el Teorema de Tchebyshev.

Hace más de un siglo, el matemático ruso P. L. Tchebyshev (1821- 1894), examinó por separado la propiedad de la variabilidad de los datos en torno a la media; encontró que, sin importar cómo se distribu- ye un conjunto de datos, el porcentaje de observaciones que están con- tenidas dentro de distancias de ±k desviaciones estándar alrededor de la media, se encuentra definido por la siguiente fórmula:

Para entender mejor el resultado del teorema veamos algunos valores que se obtienen aplicando la fórmula: Para k = 2, el teorema nos dice que:

Cuando menos 75% de las observaciones caen en ±2 desviaciones estándar con respecto a la media y también se puede expresar utilizan- do un intervalo definido como (x-2s) a (x+2s). Cuando menos 88.89% de las observaciones estarán entre la media +3 desviaciones estándar, y entre la media -3 desviaciones estándar y al menos 93.75% de los valo- res se encontrarán entre la media y ±4 desviaciones estándar.34

Aunque el Teorema de Tchebyshev es de naturaleza general y se puede aplicar a cualquier clase de distribución de valores, si los datos fueran simétricos y acampanados,35 es decir, de tipo normal, exacta-

34

Aunque k-2 y k=3, se utilizan comúnmente al aplicar el teorema, el número k no tiene que ser forzosamente un entero podría ser 2.5 desviaciones estándar, y cuando k = 2.5, 84% de las observaciones se encontrarían dentro de ese intervalo.

35

DESCRIPCIÓN Y MEDICIONES DE SERIES DE DATOS 1 1 9

mente 68.26% de todas las observaciones estarían contenidas dentro de distancias de ±1 desviación estándar alrededor de la media, mientras que 95.44, 99.73 y 99.99% de las observaciones estarían incluidas, res- pectivamente, dentro de distancias de ±2, ±3, ±4 desviaciones estándar alrededor de la media; gráficamente se ve de la siguiente forma:

Los resultados del porcentaje de puntuaciones que se concentran en torno a la media, para cualquier tipo de distribución y para distribucio- nes de tipo normal los podemos resumir en la siguiente tabla:

Ejemplo: Retomando el ejemplo de las edades de treinta personas toma- das al azar en el cual se obtuvo la siguiente distribución de frecuencias:

a. Compruebe que dentro del intervalo de ±2 desviaciones estándar se encuentra cuando menos 75% de las observaciones de la muestra. Respuesta:

Para aplicar la fórmula del Teorema de Tchebyshev necesitamos prime- ro calcular la media y la desviación estándar de los valores. Pero como ya previamente los habíamos calculado, sólo los retomaremos:

Ahora, aplicando la fórmula para k- 2 desviaciones estándar, el teore- ma afirma que:

Comprobemos que esto se cumple para nuestras observaciones. El intervalo es el siguiente:

Interpretación: Presentando los valores obtenidos en términos redondea-

dos podemos decir que el intervalo formado por ±2 desviaciones están- dar con respecto a la media contiene edades de 20 a 49 años. Ahora bien, cuántas puntuaciones de nuestra serie se encuentran dentro de ese intervalo. Si observamos nuestra tabla de distribución de frecuencias podemos ver que las edades varían de los 1 § a los 44 años, en este caso de los 20 a los 49 años se encuentran 29 de las 30 observaciones, es decir, (29/30) x 100 - 96.66%, de las observaciones que se encuentran contenidas en el intervalo obtenido aplicando la fórmula deTchebyshev. Finalmente podemos concluir que, efectivamente, se encuentra cuando menos 75% de las observaciones contenidas dentro del intervalo. Ejercicios (2.6.1):

Utilizando los ejercicios de las secciones anteriores (asimetría y curto- sis), que se mencionan a continuación, determine si realmente se cum- plen las afirmaciones hechas en el Teorema de Tchebyshev, por lo menos para ±2 y ±3 desviaciones estándar en cada uno de ellos.

DESCRIPCIÓN Y MEDICIONES DE SERIES DE DATOS 121

Lo que indica que cuando menos 75% de las observaciones caen en el

1. A partir de los siguientes datos de las calificaciones que se obtuvie- ron en un examen de estadística:

Se pide:

a) Resumir la información en un cuadro de frecuencias. b) Calcular la media y la desviación estándar.

c) Determinar si realmente se cumplen las afirmaciones hechas en el Teorema de Tchebyshev, por lo menos para ±2 y ±3 des viaciones estándar.

2. Utilizando la siguiente información:

DESCRIPCIÓN Y MEDICIONES DE SERIES DE DATOS 1 23

b) Determinar si realmente se cumplen las afirmaciones hechas en el Teorema de Tchebyshev, por lo menos para ±2 y ±3 des- viaciones estándar.

3. Con base en la siguiente tabla de las alturas de 100 estudiantes de la Escuela Superior de Economía:

a) Calcular la media y la desviación estándar.

b) Determinar si realmente se cumplen las afirmaciones hechas en el Teorema de Tchebyshev, por lo menos para ±2 y ±3 des viaciones estándar.

4. Una muestra de cantidades mensuales de dinero destinadas a ali- mentos por una persona de la tercera edad que vive sola, tiene apro- ximadamente una distribución de frecuencias simétrica de campana. La media muestral es de $150.00 pesos; la desviación estándar es de $20.00 pesos. Utilizando el enfoque para una distribución de tipo normal se pide:

a. Aproximadamente, ¿entre qué cantidades (intervalo) se encuentra 68% de los gastos mensuales en alimentos?

b. Aproximadamente, ¿entre qué cantidades (intervalo) se encuen tra 95% de los gastos mensuales en alimentos?

c. Aproximadamente, ¿entre qué cantidades (intervalo) se encuen- tran todos los gastos mensuales en alimentos?

5. En lo que respecta al Teorema de Tchebyshev, ¿al menos qué porcen taje de cualquier conjunto de observaciones se encontrará a 1.8 des viaciones estándar de la media?

6. El ingreso promedio para un grupo de observaciones muéstrales es de $500.00 pesos, la desviación estándar es de $40.00 pesos. De acuerdo con el Teorema de Tchebyshev, ¿al menos qué porcentaje de los ingresos se encontrará entre $400.00 y $600.00 pesos?

7. La distribución de los pesos de una muestra de 1400 contenedores para carga tiene aproximadamente una distribución normal. Utilizando el enfoque para una distribución de tipo normal, ¿qué porcentaje de pesos se encontrarán entre (x-2s) y (x+2s)?

Related documents