* Revisar cuidadosamente los datos antes de usarlos; verificar que no contengan errores; chequear en particular los valores extremos.
* Elaborar histogramas o cualquier otro tipo de gráfi- cos que permita visualizar la forma y las características princi- pales de la distribución de frecuencias.
* Diferenciar con precisión cuándo se hace referencia a un parámetro poblacional y cuándo a un estadístico muestral.
* Usar en forma conjunta una media de posición y una de dispersión (como mínimo) para analizar el comportamiento de la variable.
* Prestar atención a las ventajas y desventajas de las distintas medidas de posición y dispersión, para decidir correc- tamente su elección.
* Calcular la media aritmética con los datos en bruto – sin agrupar – siempre que se requiera su valor exacto.
* Dar preferencia al cálculo de la mediana como medi- da de posición, cuando la serie tiene pocos datos e incluye valores extremos.
* No tiene sentido calcular la moda en series de datos sin agrupar.
* Tanto la mediana como la moda son valores de la va- riable (no confundir con las frecuencias a las que están asocia- das).
* Comparar, siempre que se pueda, media, mediana y moda para determinar el sesgo de la distribución.
* El rango o alcance es una medida de dispersión poco apropiada para describir series con muchos datos.
PROBLEMAS PROPUESTOS
Los siguientes ejercicios, se basan en la información de esta tabla:
Fuente: DANE
1. Defina y clasifique la variable cuantificada en la tabla anterior.
2. Diga cual es la medida más adecuada para expresar la dispersión del número de obras culminadas por trimestre.
3. Calcule el rango de las obras nuevas que se paralizaron por trimestre y explique el significado que puede tener esa medida.
4. Calcule la desviación estándar del número de casas que continúan en proceso por tri- mestre en la ciudad de Pereira.
5. ¿Cuál de las columnas de la tabla tiene el mayor grado de dispersión? ¿Por que utilizó esa medida para comparar?
5
Dispersión y Asimetría6. Calcule la desviación media del total de obras que cada trimestre se encuentran en proceso, y diga el significado que puede tener esa medida, por ejemplo para un análisis de generación de empleo.
7. Investigue cuales fueron los ingresos totales de los municipios de su departa- mento durante los últimos cuatro años y determine cual fue el año con menor variación en los ingresos y cual de los municipios presenta la distribución más uniforme. (sugerencias, consulte en el DANE, o en la contraloría departamental)
8. Con los datos de la siguiente tabla que corresponden a la estadística de empresas para 1999. Si se sabe que el número de empresas en todos los ramos aumentó en 35 para el año 2000, determine la media y la varianza de la nueva variable y realice la interpreta- ción del resultado obtenido.
9. En la siguiente tabla encontramos a que se dedican las empresas en Colombia. A partir de esos datos, encontrar la media del número de empresas por área, la desviación estándar, el coeficiente de variación y la forma de la distribución. Interprete y explique los resultados.
10. Construya un mapa conceptual con los elementos estudiados a cerca de la disper- sión de datos.
11. Con los datos del ejercicio resuelto No. 3 de la unidad anterior determinar la des- viación estándar, el tipo de distribución según el grado de curtosis y el sentido de la asimetría si la hay. Explique el significado y las implicaciones de cada resultado.
12. Explique el significado de la siguiente expresión “la inestabilidad en el precio del café obligó a los caficultores a crear un fondo que guardara dinero de las bonanzas para reponer en las crisis del precio”
13. Invente un escenario a manera de cuento o sociodrama en el que las medidas de dispersión relativa sean muy importantes. A partir de este explique la importancia de tales medidas.
14. En un artículo titulado “You aren’t paranoid if you think someone eyes your every move” (Usted no es paranoico si cree que alguien observa todo lo que hace), el Wall Street Journal señala que las grandes empresas compilan estadísticas detalladas acerca del compor- tamiento de cada persona. Afirma que Jockey Internacional sabe cuantos juegos de ropa interior posee; que Frito – Lay Inc, sabe que prefiere comer primero trozos de pretzels en paquete o enteros; y que, para concretar, Coca - Cola sabe que se ponen 3,2 cubos de hielo en cada vaso. ¿ha puesto usted alguna vez 3,2 cubos de hielo en su vaso? ¿Qué quería decir el artículo Wall Street Journal con esta afirmación?
15. Encuentre el rango de los precios del dólar durante el mes pasado y explique el significado del resultado. ¿Es apropiada la medida para determinar la variabilidad del dólar?
16. Encuentre un ejemplo relacionado con la administración pública y la realidad na- cional en el que aplique la mayoría de las medidas de tendencia central y variabilidad estudia- das en este curso.
5
Dispersión y AsimetríaPROBLEMAS RESUELTOS
1. Con la información contenida en la siguiente tabla, calcular el índice medio de la tasa de cambio real por país, la desviación estándar para cada caso y el coeficiente de varia- ción. Interpretar los resultados.
Indice de la Tasa de Cambio Real Bilateral de Colombia Frente a Países Latinoamericanos 1999 – 2001
Fuente: Cálculos DANE con base en FMI
Para la solución de este nos apoyaremos en la hoja de cálculo, veamos las operaciones:
Aunque en la figura no se alcanza a mostrar la totalidad de los datos, si es clara la operación que se describe en las últimas tres filas. En la fila 28 se calcula la media de los índices de tasa de cambio por país, como el promedio aritmético de los datos de la columna respectiva. En la fila 29 se calcula la desviación estándar poblacional de los mismos datos y en la fila 30 se calcula la relación entre la desviación típica o estándar y la media, que dándole formato de porcentaje a la celda de la hoja de cálculo, nos indica- rá el valor del coeficiente de variación estándar. Veamos el resultado:
A partir de la media vemos que el índice de la tasa de cambio real es mayor para México y Venezuela cuyos valores medios son 131.60 y 121.48 respectivamente, también son estos los que presentan mayor variabilidad con desviaciones estándar respectivas de 31.43 y 34.44, notemos que el tamaño de la media no en todos los casos aumentó proporcionalmente a la desviación estándar. Para el caso de Venezuela y México vemos que el índice de tasa de cambio para Venezuela es menor al de Méxi- co pero la desviación estándar del mismo es mayor.
Para Brasil y Ecuador se dan los menores promedios de índice de tasa de cambio, sin embargo las menores variabilidades se dan para los índices correspondientes a Chile y Perú, lo anterior nos evidencia que la media no nos puede afirmar nada acerca de la dispersión de los datos si no se acompaña de la desviación estándar o de la varianza.
Otro aspecto a notar es que la desviación típica y el coeficiente de variación tienden a variar en el mismo sentido, sin embargo, a pesar que estamos comparando conjuntos de datos con tamaños iguales y con tipos de unidades iguales, vemos que por ejemplo al comparar las medidas de dispersión para Argentina y Bolivia tenemos que para los índices de tasa de cambio referentes a cada país, la desviación típica en el caso de
5
Dispersión y AsimetríaArgentina es menor que la correspondiente a Bolivia, sin embargo al evaluar el coeficien- te de variación estándar encontramos que es relativamente mas disperso el conjunto de índices para Argentina que para Bolivia.
Finalmente, vemos que si quisiéramos escoger para establecer actividades comerciales los países con los que la tasa de cambio permanezca más homogénea, entonces escoge- ríamos en orden a Chile, Perú, Bolivia y Argentina.
2. Con la información de la distribución de frecuencia que hemos usado en las unidades anteriores que se refiere a la estatura de un grupo de deportistas, evaluar la fiabilidad del teorema de Tchebisheff cuando afirma que por lo menos el 75% de las observaciones se encuentran entre 2 desviaciones estándar de la media.
Ya se había calculado la media para la distribución que es 146.32, y la desviación están- dar que corresponde a 7.37, entonces debemos mostrar que dentro del intervalo [146.32 – 2(7.37), 146.32 + 2(7.37)] = [131.58, 161.06] están el 75% o más observaciones.
El resultado se nota sin necesidad de hallar el porcentaje total de datos incluidos en este intervalo. Veamos que dentro de dicho intervalo se ubican íntegramente cinco intervalos de clase y fracción de otros dos. Contando solamente las observaciones contenidas en los intervalos que están completos tenemos 98 (veamos los intervalos sombreados en la tabla siguiente) que corresponden ya al 90.74% de los datos. Como 90.74%¦75% vemos reafirmada la certeza del teorema de Tchebicheff.
3. Con la información del ejercicio anterior, encuentre el sesgo de la distribución.
Usemos el coeficiente de Pearson,
La distribución es simétrica, podría decirse que no tiene sesgo o que su sesgo hacia la derecha es casi despreciable.
4. Determine cual medida de dispersión se puede aplicar al siguiente enunciado y calcúlela: “El precio interno del café presentó múltiples variaciones durante al año pasado, según información proporcionada por la Federación de Cafeteros el precio cambió en 23 oportunidades, el precio más alto registrado fue de $450.300 y el más bajo de $325.450 por carga”
Con la información disponible sólo podemos hallar el rango, sin embargo no sabemos nada si esa variabilidad se vio afectada por un valor extremo, ni por cuanto tiempo se mantuvo cada uno, ni cuanto café se negoció a cada precio.
El rango entonces fue de 450.300 – 325.450 = 124.850, como vemos una medida burda pero muy sencilla de calcular.
5
Dispersión y AsimetríaBIBLIOGRAFÍA
FERNÁNDEZ, Felipe; MONROY, Olga L.; RODRÍGUEZ, Liliana. Diseño, desarrollo y evaluación de situaciones proble- máticas en estadística. Universidad de los Andes: una Empresa Docente. Bogotá D.C., 1998.
HOEL, Paul G. Y JESSEN, Raymond J. Estadística Básica para Negocios y Economía. Compañía Editorial Continen- tal S.A. 2da Edición. México, 1985.
LEVIN, Richard I.; RUBIN, David S. Estadística Para Admi- nistradores, Editorial PRENTICE HALL, Sexta Edición., 1996
MENDENHALL, William. Estadística para Administradores. Traducido por Dirk Valckx Verbeeck. Grupo Editorial Iberoamérica. México, 1990.
PORTUS GOVINDEN, Lincoyan. Curso Práctico de Esta- dística. Editorial Mc Graw Hill. Bogotá D.C., 1985.
SPIEGEL, Murray R. Estadística. Traducido por Rafael Hernández Heredero. Editorial Mc Graw Hill. 2da Edi- ción. Madrid, 1998.