• No results found

65 Section 2»S Treatment of Data

the concentration of the halide ion in solution* Thus the replacement

65 Section 2»S Treatment of Data

A la hora de analizar las frecuencias, puede ser interesante representar las tablas de una manera más visual, para lo que se dispone de diferentes tipos de representaciones gráficas.

El diagrama de barras se suele utilizar para presentar las frecuencias de variables cualitativas. Para cada

valor que puede tomar la variable, se construye una barra o columna de altura proporcional a la frecuen- cia con la que ha aparecido. Se puede hacer a partir de una tabla de frecuencias, tanto relativas o porcen- tuales como absolutas. Aunque no es muy común, se pueden usar también frecuencias acumuladas.

Análogamente, el diagrama de sectores (más popularmente conocido como tarta) representa la frecuen- cia observada mediante el área de los sectores de un círculo.

Se presentan dos tablas de frecuencia con variables cualitativas y sus respectivos diagramas, a partir del ejemplo anterior y de una encuesta sobre consumo de productos de Comercio Justo.

Sexo del alumnado de la clase Tabla de frecuencias

Sexo Frecuencia absoluta (ni)

Alumnos 8

Alumnas 10

¿Ha consumido algún producto de Comercio Justo en el año 2007? Tabla de frecuencias

consumCJ absoluta (ni) relativa (fi) porcentual (pi)

Sí 837 0,26 26,01%

No 2253 0,70 70,01%

No contesta 128 0,04 3,98%

Alumnos Alumnas

Figura 7: Diagrama de barras sobre sexo del alumnado Fuente: elaboración propia

Figura 8: Diagrama de tarta sobre consumo de Comercio Justo Fuente: barometro.fundacioneroski.es/2007/consumo-de-productos-de-

comercio-justo [12-6-2012]

Para variables cuantitativas, resulta más interesante utilizar un histograma. A partir de una tabla de fre- cuencias simple (para cuantitativas discretas) o agrupada (para cuantitativas discretas y continuas), se elabora una representación gráfica en forma de columnas, cuyas alturas son proporcionales a la frecuen- cia (relativa o absoluta) de los valores representados. Es muy parecido a un diagrama de barras, con la diferencia de que el eje horizontal también tiene escala; es como si fuese una regla, con intervalos pro- porcionales numerados. Como se ve en el ejemplo más abajo, para frecuencias agrupadas las barras se sitúan en la mitad del intervalo. Se le puede añadir una línea (en azul en el ejemplo) para formar lo que se conoce como el polígono de frecuencias.

Análogamente se pueden elaborar histogramas y polígonos de frecuencias acumuladas.

A partir de la tabla anterior de frecuencias agrupadas de las puntaciones del alumnado, se obtendrían los histogramas (y polígonos) que aparecen a continuación.

8 10 0 2 4 6 8 10 12

Figura 9: Histograma de frecuencias absolutas Fuente: elaboración propia

Figura 10: Histograma de frecuencias relativas acumuladas Fuente: elaboración propia

Cuando la variable es continua y la muestra es lo bastante grande, se podría hacer un histograma con las frecuencias sin agrupar. En realidad estaríamos hablando una distribución de frecuencias continuas. En el eje horizontal aparecen los valores que puede tomar la variable y en el eje vertical la frecuencia (relati- va) con la que aparece.

Suponiendo que se hace nuevamente el examen de estadística a un grupo muy grande de alumnos y alumnas, la distribución de frecuencias continuas quedaría tal como se aprecia en la figura siguiente. Su polígono de frecuencias sería prácticamente una curva.

Figura 11: Diagrama de barras sobre sexo del alumnado Fuente: elaboración propia

Esa curva se llama distribución de densidad de frecuencias o distribución de

probabilidad, y representa en vertical la proporción con que aparece cada

valor (del eje horizontal). En la curva del ejemplo, las flechas sirven para ejemplificarlo. La proporción (frecuencia relativa) de alumnos que obtienen un 10 es de 3,2% aproximadamente. 0 2 4 6 8 10 12 3 8 13 18 Puntuación 0 0,2 0,4 0,6 0,8 1 1,2 3 8 13 18 Puntuación 0 5 10 15 20 Puntuación

Distribución: curva que indica la probabilidad de observación de toda la gama de valores que puede presentar una variable.

Las distribuciones son muy útiles para visualizar rápidamente cómo se reparten los distintos valores en la muestra, aunque no suelen ser prácticas para encuestas de tamaño medio o pequeño.

Por otro lado, es muy importante comprender el concepto de la distribución en sí, pues hay distintos mo- delos teóricos de distribuciones que son útiles para entender diversos

fenómenos o para calcular, por ejemplo, el tamaño de muestra necesario. Así encontraremos tipos de variables que se distribuyen de forma simétri- ca, otras de forma asimétrica, etc.

La distribución del ejemplo anterior es una distribución simétrica, más concretamente una distribución normal. Esta distribución es muy común en la vida real y, al realizar histogramas a partir de una muestra, en mu- chas ocasiones tendrán una forma parecida a la distribución normal. Las notas de un examen, el peso de personas de una misma edad son ejem- plos de tipos de variable que suelen presentar una distribución normal. Otras variables pueden dar otro tipo de distribuciones.

Por ejemplo, las variables económicas como los ingresos familiares suelen presentar distribuciones asimétricas positivas, donde gran parte de la muestra tiene unos ingresos bajos (cima de la curva en el lado izquierdo) y una pequeña parte tiene ingresos muy altos (cola alargada hacia la de- recha). Recordando el sistema de las flechas, vemos que con bajos ingre- sos (parte izquierda del eje horizontal) hay un alto porcentaje de perso-

nas (cima de la curva). Con ingresos altos, hay un porcentaje bajo (cola de la curva muy baja).

Cuando la muestra es muy homogénea, las distribuciones son más bien apuntadas, mostrando mucha concentración de los datos alrededor de la media. Es decir, si en una ciudad no hay ni ricos ni pobres, todos los habitantes tendrán una renta parecida, que coincidirá con

el valor que se sitúa bajo la cima de la curva, al representar ésta el valor más observado.

Hay también distribuciones asimétricas negativas, distribuciones simétricas que no son normales, etc. Más adelante se profundizará en esto, pero es vital entender bien el concepto de distribución y lo que representa para avanzar en este tema, por lo que se recomienda releer este apartado hasta que quede claro.

A modo de resumen, recordar que las distribuciones son curvas que representan la proporción (frecuencia relativa) con que se observan los distintos valores de una determinada variable obtenidos de una

muestra. Nos facilitan de un vistazo información sobre la posición (¿dónde se sitúa la mayoría?) y disper- sión (¿están concentrados o hay muchas diferencias?).

Pero como con los vistazos no nos vale, veremos a continuación formas de medir tanto la posición como la dispersión.

Actividad de refuerzo 4:

Revisa los ejemplos de diagrama de tarta e histograma y responde para cada uno: ¿Cuál es la varia- ble? ¿De qué tipo de variable se trata? ¿Qué valores puede tomar?

A partir de las tablas de frecuencias realizadas en las actividades de refuerzo anteriores, elabora sen-

Distribución normal

Distribución asimétrica

Distribución simétrica apuntada

Figura 12: Simetría en las distribuciones Fuente: elaboración propia

Figura 13: Posición y dispersión Fuente:

www.erasmusweb.com/admin/pdf/53/22 4/Tema%201%20Estadistica%20descriptiv a%20unidimensional.pdf [12-6-2012]

dos histogramas de frecuencias simples.

A partir de los datos del estudio en Logone Occidental, haz un diagrama de barras o de sectores para representar cuántas familias han sido entrevistadas en cada departamento.

Explica, con tus propias palabras, lo que es una distribución.