Evolution of Command – Regular, New Army and Territorial Battalions
4.1 The Regular Battalions
Da el mismo resultado cuando las cantidades a que nos referimos son magnitudes constantes. Para saber cuántos huevos hay en 8 docenas, como el número de huevos en una docena es una constante, podemos sumar 12 huevos 8 veces o multiplicar 12 por 8 (¡evidente!). Pero si lo que tenemos es una variable aleatoria, como el peso de un huevo, esto ya no es verdad. No es lo mismo el peso de una docena de huevos que el peso de un huevo multiplicado por 12.
No es lo mismo porque aunque las 2 variables obtenidas tienen el mismo valor medio, no tienen la misma variabilidad, y por tanto ya no podremos decir que sean iguales.
Para entender por qué esto es así, aclararemos en primer lugar el significado de la notación que vamos a utilizar. Llamaremos X a la variable aleatoria que consideramos (en nuestro ejemplo el peso de un huevo), podríamos decir que X se distribuye según una Normal, pero no necesitamos hacer referencia a ninguna distribución en concreto, sólo hay que tener claro que no es un valor fijo, sino una variable aleatoria. Si tomamos una docena, designaremos los pesos como X1, X2, ..., X12. Cada una de las Xi es una variable aleatoria con idéntica
distribución que X. En realidad son extracciones de la misma población, el subíndice solo indica el orden en que extraen.
Echando mano de las fórmulas correspondientes, y suponiendo que los 12 pesos son independientes, tendremos que la esperanza matemática y la varianza del peso de una docena será:
19
¿Por qué da un resultado distinto sumar k variables aleatoriasde la misma distribución de probabilidad que tomar una y
multiplicarla por k?
Docena: Todos los huevos son distintos
1 2 3 4 5 6 7 8 9 10 11 12
Figura 19.1. Peso de una docena de huevos. En la docena habrá huevos más grandes de lo normal y otros más pequeños (en el dibujo se han exagerado las diferencias), y sus pesos tenderán a compensarse
Sin embargo, en la variable “peso de un huevo multiplicado por 12”, si el huevo elegido resulta ser pequeño, es como tener una docena de huevos pequeños; y si es grande sería como una docena de huevos grandes, con lo que tendremos pesos totales con más dispersión que en el caso anterior (porque en este caso no se compensan los grandes con los pequeños).
Un huevo multiplicado por 12: Si es pequeño (o grande) es como tener 12 pequeños (o grandes)
Figura 19.2. Peso de un huevo multiplicado por 12. Si el huevo es singularmente pequeño es como tener una docena con todos los huevos pequeños. Igual si es grande
Luego, tiene más dispersión la variable aleatoria “peso de un huevo multiplicado por 12” que la variable “peso de una docena”. Y si la variabilidad es distinta, evidentemente las variables son distintas.
Esto nos obligará a estar atentos para no confundir lo que es la suma de k variables con el producto de una multiplicado por k (¡estamos tan acostumbrados a pensar que es lo mismo!). Para comprobar que sí sabe distinguir estas situaciones le sugerimos que piense en estas 4 que le planteamos.
a) El número de personas que suben por día a una atracción de feria es una variable aleatoria X. Si la atracción cuesta k, ¿cuánto vale la varianza de la recaudación diaria? b) Se fabrican bolas de plástico cuyo volumen es una variable aleatoria Y, y su densidad
es k. ¿Cuál es la varianza del peso de las bolas?
c) El valor de una resistencia eléctrica es una variable aleatoria Z. ¿Cuánto vale la varianza de la resistencia que resulta de conectar en serie k de estas unidades?
d) Unas barras metálicas tienen una longitud que es una variable aleatoria W. ¿Cuánto vale la varianza de la longitud de k de estas barras colocadas una a continuación de otra?1
Respuestas a dudas típicas de ESTADÍSTICA
55
62
También es cierto que al tomar una sola muestra, conocemos un solo valor de la media muestral, y no tenemos manera de saber si se encuentra cerca o lejos de la media po- blacional, pero para tratar con este inconveniente utilizamos la siguiente propiedad.
La variabilidad de la media disminuye al aumentar el tamaño de la muestra
Supongamos que la variabilidad de los datos viene definida por V=4. Podemos calcular el número de elementos que debemos incluir en la muestra para que, por ejemplo, el 99,7% de las medias muestrales caigan a una distancia de menos de 2 unidades de la media poblacional (podría ser el círculo más pequeño de la diana).
Situación A Situación B
No hay sesgo: los posibles valores de la media muestral tienen como centro la media pobla- cional.
Hay sesgo: entre el centro de los posibles valores estimados y el parámetro de interés hay una distancia, un sesgo.
Figura 20.1. Una mirada gráfica del insesgamiento de la media
Los puntos son posibles valores de x P Parámetro a estimar Sesgo
La respuesta a esta pregunta constituye la esencia de la teoría del muestreo estadís- tico y para responderla de una forma más concreta nos centraremos en la media. La cla- ve está en que la media de la muestra, como muchos de los estimadores utiliza- dos, tiene 2 importantes propiedades:
El valor medio de la media muestral coincide con la media de la población
La media varía de una muestra a otra, pero esta variabilidad se produce en torno al valor de la media poblacional. Es decir, si repetimos el proceso de muestreo, aunque los valores de las medias serán distintos, todos ellos se encontrarán agrupados (con mayor o menor dispersión) en torno a la media de la población. Cuando un estimador tiene esta propiedad se dice que es insesgado.