• No results found

CONCLUSIONS AND RECOMMENDATIONS FOR FUTURE STUDY Introduction

CHAPTER III RESEARCH METHODS

CONCLUSIONS AND RECOMMENDATIONS FOR FUTURE STUDY Introduction

1. En el Departamento de Personal de una fábrica se ha realizado un estudio estadístico en relación a los salarios mensuales percibidos por los trabajadores en miles de pesos. El resultado de una muestra de 60 empleados arrojó los siguientes datos:

3.0 4.0 3.3 3.0 3.4 3.1 3.9 3.8 3.8 4.0 3.9 3.7 3.9 3.2 3.0 3.5 4.0 3.8 4.0 3.6 3.0 3.2 3.5 3.8 3.4 3.8 3.7 3.5 3.5 3.7 3.5 3.3 3.7 3.6 3.2 3.6 3.7 3.4 3.6 3.3 3.6 3.0 3.3 3.9 3.2 3.0 3.9 3.7 3.7 3.4 3.1 3.6 3.8 3.1 3.8 3.6 3.9 3.1 3.6 3.5

Con base en la información de la muestra,

a) Construye el diagrama de tallo y hojas para los datos dados.

b) Obtén la distribución de frecuencias para los datos no agrupados de la muestra. c) Calcula la media, mediana y moda para la distribución de frecuencias del inciso b).

d) Construye una distribución de frecuencias de datos agrupados de cinco intervalos igualmente espaciados. e) Calcula la media, moda y mediana para los datos agrupados y compara los resultados obtenidos en el caso c). ¿Qué puedes argumentar al respecto?

f) Con la distribución de frecuencias del inciso d), construye los gráficos siguientes; 1) El histograma.

2) El polígono de frecuencias. 3) La ojiva “menor qué” 4) La ojiva “mayor qué”

g) Construye los diagramas de caja para con los datos obtenidos en los incisos c) y e) y compáralos. ¿Qué puedes decir al respecto?

2. Para la empresa SAMID y Asociados, la cantidad diaria producida (en miles de unidades) está dada por la siguiente distribución de frecuencias:

Departamento de Matemáticas 40 Universidad de Sonora.

Cantidad diaria producida (en miles)

Frecuencia Absoluta De 5 a menos de 15 13 De 15 a menos de 25 x De 25 a menos de 35 y De 35 a menos de 45 8 De 45 a menos de 55 7

El gerente de producción ha perdido dos datos, pero asegura que la suma de las cantidades faltantes es el doble del promedio de la producción diaria. A partir de la información de la tabla y de lo que asegura el gerente, se desea saber:

a) El valor de x y de y, si se sabe que la cantidad promedio de la producción diaria es de 26 mil unidades. b) Los valores de mediana, moda, varianza y desviación estándar para la producción diaria.

c) El tercer cuartil, el noveno decil y el percentil número 15.

d) El coeficiente de variación, el coeficiente de asimetría de Pearson, y los coeficientes de asimetría y curtosis de Fisher.

e) Conforme a la comparación de las medidas centrales (promedio, mediana y moda) obtenidas en el inciso b), la distribución de las cantidades diarias de producción es: i) Asimétrica a la derecha, ii) Asimétrica a la izquierda, iii) Simétrica o iv) Uniforme.

f) De acuerdo al coeficiente de variación obtenido en el inciso d), las cantidades diarias de producción son: i) Heterogéneos, ii) Homogéneos, iii) Muy heterogéneos o iv) Muy Homogéneos.

g) Conforme al coeficiente de asimetría de Pearson obtenido en el inciso d), la forma de la distribución de los datos dados en la tabla es i) Disimétrica negativa, ii) Uniforme, iii) Disimétrica positiva o iv) Simétrica. h) De acuerdo al coeficiente de Asimetría de Fisher obtenido en el inciso d), la distribución de las cantidades diarias de producción está: i) Sesgada a la Izquierda, ii) Sesgada a la derecha, iii) Insesgada o iv) Invariante. i) De acuerdo al coeficiente de curtosis de Fisher obtenidos en d), la forma de la distribución de las cantidades diarias de producción es: i) Leptocúrtica, ii) Mesocúrtica, iii) Cuasicúrtica o iv) Platicúrtica.

3. Una empresa se dedica a la fabricación de barras de acero, para ello usa una máquina, cuyas características hacen que la longitud de éstas no pueda ser mayor de 50 cm. Se realizó una muestra de la producción de la máquina en una determinada hora de funcionamiento, las longitudes de las barras producidas fueron las siguientes:

Longitud (en cm.) Cantidad de barras

Menos de10 3 De 10 a menos de 20 12 De 20 a menos de 25 27 De 25 a menos de 30 37 De 30 a menos de 40 20 40 a menos de 45 25

a) Con los datos de la tabla, determina, para esa hora específica, los valores para la longitud de esas barras de la 1) media, 2) mediana, 3) moda, 4) varianza, 5) percentil número 35, 6) segundo decil,7) primer cuartil, 8) coeficiente de variación, 9) coeficiente de asimetría de Pearson, 10) coeficiente de asimetría de Fisher y 11) coeficiente de curtosis.

b) Conforme a la comparación de las medidas centrales (promedio, mediana y moda) obtenidas en los puntos 1, 2 y 3 del inciso a), la distribución de la longitud de las barras es: i) Asimétrica a la derecha, ii) Asimétrica a la izquierda, iii) Simétrica o iv) Uniforme.

c) De acuerdo al coeficiente de variación obtenido en el apartado 8) del inciso a), las longitudes de las barras son: i) Heterogéneos, ii) Homogéneos, iii) Muy heterogéneos o iv) Muy Homogéneos.

Departamento de Matemáticas 41 Universidad de Sonora.

d) Conforme al coeficiente de asimetría de Pearson obtenido en el apartado 9) del inciso a), la forma de la distribución de los datos es i) Disimétrica negativa, ii) Uniforme, iii) Disimétrica positiva o iv) Simétrica. e) De acuerdo al coeficiente de Asimetría de Fisher obtenido en el apartado 10) del inciso a), la distribución de la longitud de las barras está: i) Sesgada a la Izquierda, ii) Sesgada a la derecha, iii) Insesgada o iv) Invariante.

f) De acuerdo al coeficiente de curtosis de Fisher obtenidos en el apartado 11) del inciso a), la forma de la distribución de la longitud delas barras es: i) Leptocúrtica,ii) Mesocúrtica, iii) Cuasicúrtica o iv) Platicúrtica.

4. En una muestra realizada en las dos sucursales de una empresa determinada, se obtuvieron las siguientes distribuciones de frecuencias de los montos de las ventas diarias realizadas en miles de pesos.

Sucursal A Sucursal B

Monto de las ventas (miles de pesos)

Número de días

Monto de las ventas (miles de pesos) Número de días Menos de 90 7 Menos de 70 5 De 90 a menos de 150 16 De 70 a menos de 200 28 De 150 a menos de 300 37 De 200 a menos de 350 27 De 300 a menos de 600 28 De 350 a menos de 700 30 De 600 a menos de 960 12 De 700 a menos de 850 10 Total 100 Total 100

a) Con los datos de la tablas, determina, para cada sucursal, los valores para el monto de las ventas de la 1) media, 2) mediana, 3) moda, 4) varianza, 5) percentil número 35, 6) segundo decil, 7) primer cuartil, 8) coeficiente de variación, 9) coeficiente de asimetría de Pearson, 10) coeficiente de asimetría de Fisher y 11) coeficiente de curtosis.

b) Conforme a la comparación de las medidas centrales (promedio, mediana y moda) obtenidas en los puntos 1, 2 y 3 del inciso a), la distribución de las ventas de cada sucursal es: i) Asimétrica a la derecha, ii) Asimétrica a la izquierda, iii) Simétrica o iv) Uniforme.

c) De acuerdo al coeficiente de variación obtenido en el apartado 8) del inciso a), los montos de las ventas de cada sucursal son: i) Heterogéneos, ii) Homogéneos, iii) Muy heterogéneos o iv) Muy Homogéneos.

d) Conforme al coeficiente de asimetría de Pearson obtenido en el inciso 9, la forma de la distribución de los datos para cada sucursal es i) Disimétrica negativa, ii) Uniforme, iii) Disimétrica positiva o iv) Simétrica. e) De acuerdo al coeficiente de Asimetría de Fisher obtenido en el apartado 10) del inciso a), la distribución de los montos de las ventas de cada sucursal está: i) Sesgada a la Izquierda, ii) Sesgada a la derecha, iii) Insesgada o iv) Invariante.

f) De acuerdo al coeficiente de curtosis de Fisher obtenidos en el apartado 11) del inciso a), la forma de la distribución de los montos de las ventas de cada una de las sucursales es: i) Leptocúrtica, ii) Mesocúrtica, iii) Cuasicúrtica o iv) Platicúrtica.

g) En base a ambas distribuciones, responde a las siguientes preguntas: 1) ¿Cuál de las dos tiene menor dispersión?

2) ¿Para qué empresa resulta más representativo el monto de ventas promedio?

3) ¿Cuál de las dos empresas se encuentra con una distribución de las ventas más equilibrada o con menos variabilidad?

5. “La dureza de los árboles es difícil de medir directamente, sin embargo la densidad si es relativamente fácil de medir. Por ello es de gran interés disponer de un modelo que permita predecir la dureza de un árbol a partir de su densidad. Por este motivo se ha tomado una muestra de 36 eucaliptos y se les midió su densidad (X) y su dureza (Y ). Los resultados obtenidos son los de la tabla adjunta.

Departamento de Matemáticas 42 Universidad de Sonora. Densidad Dureza Densidad Dureza Densidad Dureza

24.7 484 39.4 1210 53.4 1880 24.8 427 39.9 989 56.0 1980 27.3 413 40.3 1160 56.5 1820 28.4 517 40.6 1010 57.3 2020 28.4 549 40.7 1100 57.6 1980 29.0 648 40.7 1130 59.2 2310 30.3 587 42.9 1270 59.8 1940 32.7 704 45.8 1180 66.0 3260 35.6 979 46.9 1400 67.4 2700 38.5 914 48.2 1760 68.8 2890 38.8 1070 51.5 1710 69.1 2740 39.3 1020 51.5 2010 69.1 3140

Con los datos dados en la tabla,

a) Construye un diagrama de dispersión y comenta si existe algún tipo de relación entre las dos variables involucradas, ¿la relación es lineal o no lineal?

b) Determine el coeficiente de correlación e interpreta el resultado encontrado.

c) Calcula el coeficiente de determinación y en base al resultado obtenido determina si se puede explicar el consumo de dureza del árbol por una relación lineal con su densidad.

d) Determine el modelo de regresión lineal simple.

e) Usando el modelo hallado en el inciso anterior, prediga la dureza de un árbol de densidad 20 y 60 unidades respectivamente

f) Usando el modelo del inciso d), prediga la densidad de un árbol de dureza 300 y 4000 respectivamente.

6. “En quince casas de la ciudad de Milton Keynes se observó durante un período de tiempo la diferencia de temperatura promedio (en grados centígrados) entre la temperatura en la calle y la temperatura en casa, y el consumo de gas diario en kWh.

Diferencia de Temperatura. Consumo Diferencia de Temperatura. Consumo Diferencia de Temperatura. Consumo 10.3 69.81 13.4 75.32 15.6 86.35 11.4 82.75 13.6 69.81 16.4 110.23 11.5 81.75 15.0 78.54 16.5 106.55 12.5 80.38 15.2 81.29 17.0 85.50 13.1 85.89 15.3 99.20 17.1 90.02

Con los datos anteriores,

a) Construye un diagrama de dispersión. ¿Existe relación entre estas dos variables?

b) Construye un diagrama de dispersión y comenta el tipo de correlación existente entre las dos variables involucradas, ¿la relación es lineal o no lineal?

c) Determine el coeficiente de correlación e interprete el resultado.

d) Calcule el coeficiente de determinación ¿Se puede explicar la diferencia de la temperatura mediante la relación lineal con el consumo de gas?

e) Determine el modelo de regresión lineal simple.

f) Usando el modelo hallado en el inciso anterior, prediga el consumo de energía si la diferencia es de 20 y 60 grados respectivamente.

g) Usando el modelo del inciso d), prediga la diferencia en la temperatura si el consumo de energía es de 85 y 90 unidades.

Departamento de Matemáticas 43 Universidad de Sonora.

7. La Tabla de abajo presenta una muestra del número de horas trabajadas (X) en una fábrica, y las unidades producidas (Y) de artículos.

Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62

Producción (Y) 300 302 315 330 300 250 300 340 315 330 310 240

Con los datos dados en la Tabla,

a) Construye un diagrama de dispersión y comenta si existe algún tipo de relación entre las dos variables involucradas, ¿la relación es lineal o no lineal?

b) Determine el coeficiente de correlación e interprete el resultado. c) Calcule el coeficiente de determinación e interprete el resultado d) Determine el modelo de regresión lineal simple.

e) Usando el modelo hallado en el inciso anterior, prediga la cantidad de unidades que se espera producir si se trabajan 120 horas.

f) Usando el modelo del inciso d), prediga las posibles horas trabajo, si las unidades producidas fueron de 350.

8. Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido elaborar la tabla siguiente: Nº de hrs dormidas (X) Nº de hrs de TV (Y) Nº de hrs dormidas (X) Nº de hrs de TV (Y) Nº de Hrs dormidas (X) Nº de Hrs de TV (Y) Nº de Hrs dormidas (X) Nº de Hrs de TV (Y) 6 4 8 3 8 3 8 3 7 3 7 3 7 3 7 3 8 3 9 2 8 3 9 2 9 2 6 4 7 3 6 4 7 3 8 3 8 3 7 3 7 3 7 3 9 2 8 3 8 3 7 3 7 3 7 3 9 2 8 3 8 3 8 3 7 3 9 2 9 2 9 2 8 3 7 3 7 3 8 3 8 3 8 3 8 3 9 2 8 3 10 1 8 3 9 2 8 3 7 3

Con los datos dados en la tabla,

a) Construye un diagrama de dispersión y comenta si existe algún tipo de relación entre las dos variables involucradas, ¿la relación es lineal o no lineal?

b) Determine el coeficiente de correlación e interprete el resultado. c) Calcule el coeficiente de determinación e interprete el resultado d) Determine el modelo de regresión lineal simple.

e) Usando el modelo hallado en el inciso anterior, prediga la cantidad de unidades que se espera duerma una persona que ve la TV durante 1.5 horas.

f) Usando el modelo del inciso d), prediga las posibles horas que una persona ve TV, si las horas que duerme son de 8.5 hrs.

Nota: Los datos utilizados en los problemas 5 y 6, han sido tomados del libro “Ahandbook of small data sets”, editado por D.J. Hand, F. Daly, A.D.

Departamento de Matemáticas 44 Universidad de Sonora.

2.15. Lecturas recomendadas.

Related documents