3.2 CSI based Localization and Human Monitoring
3.2.1 Multi-resolution Wireless Sensing Strategy
A lo largo de esta ayuda se ha indicado en diferentes ocasiones la necesidad de que la variable o variables a estudio verifiquen el supuesto de normalidad para poder aplicar las técnicas descritas en cada caso.
Existen muchas pruebas que permiten contrastar la hipótesis nula de que los datos provienen de una distribución normal. De entre todas ellas, las pruebas seleccionadas para Epidat 4 fueron: el contraste de Shapiro-Francia y el contraste de asimetría y curtosis.
El contraste de Shapiro-Francia fue propuesto por Shapiro y Francia, en el año 1972 [20], como una modificación del contraste de normalidad de Shapiro-Wilk [21] válida en muestras de mayor tamaño. Años más tarde, Royston presentó una aproximación para los dos contrastes (Shapiro-Wilk [22] y Shapiro-Francia [23]) que permitió ampliar el rango de valores para el tamaño de muestra, a la hora de aplicar cada uno de los contrastes ([4, 2.000] y [5, 5.000], respectivamente). Ambos contrastes se consideran de los más potentes a la hora de contrastar la normalidad de los datos, aunque no se recomienda su empleo cuando la muestra presenta empates (es decir, valores repetidos) [24].
El contraste de asimetría y curtosis está basado en el contraste desarrollado por D'Agostino, Balanger y D'Agostino Jr's [25] pero considerando el ajuste propuesto por Royston [26], ya que, según él, el contraste sin ajustar resulta insatisfactorio. Este contraste no está definido para tamaños de muestra inferiores a 8 [26].
El contraste de asimetría y curtosis engloba tres diferentes (el contraste de asimetría, el contraste de curtosis y el contraste conjunto de asimetría y curtosis) y se fundamenta en los coeficientes de asimetría y curtosis, que permiten describir la forma de la distribución asociada a los datos de la muestra.
El contraste de asimetría permite contrastar la hipótesis nula de normalidad de los datos frente a la alternativa de que los datos no son normales debido a la presencia de asimetría. En este caso, el contraste está basado únicamente en el coeficiente de asimetría que cuantifica en qué medida las observaciones de un conjunto de datos se distribuyen simétricamente alrededor de la media. Si la variable es simétrica entonces el coeficiente de asimetría toma el valor cero.
El contraste de curtosis considera la misma hipótesis nula de normalidad y como hipótesis alternativa la no normalidad debido a curtosis no normal. En este caso, el contraste está basado únicamente en el coeficiente de curtosis que mide el grado de apuntamiento de una distribución con respecto a la distribución normal con la misma media y varianza. Si la distribución presenta el mismo perfil que la normal con la misma media y varianza, entonces el coeficiente de curtosis toma el valor cero.
El contraste de asimetría y curtosis está basado en los estadísticos obtenidos de los contrastes anteriores y contrasta la hipótesis nula de normalidad frente a la alternativa de no normalidad debido a problemas de asimetría o curtosis.
Entre los contrastes Shapiro-Francia y de asimetría y curtosis, se recomienda el empleo del primero siempre que sea posible, dadas sus buenas propiedades. En caso de rechazar la normalidad por medio de este contraste, el contraste de asimetría y curtosis permite
Por otro lado, es aconsejable no dejarse guiar única y exclusivamente por los resultados de un determinado contraste, por lo que se recomienda acompañar dichos resultados de un gráfico que dé idea de la distribución de los datos. En esta línea, en Epidat se da la opción de emplear el gráfico cuantil-cuantil (o Q-Q plot), asociado a la distribución normal.
Este gráfico permite comparar, por medio de un gráfico de dispersión, los valores ordenados de la muestra (representados en el eje de ordenadas: eje Y) con los correspondientes cuantiles de la distribución normal con la misma media y desviación estándar muestrales (representados en el eje de abscisas: eje X).
Si los puntos del gráfico de dispersión se sitúan en la diagonal o próximos a ella, se podría pensar que los datos de la muestra provienen de una distribución normal. En caso contrario, este gráfico indicaría que los datos no son normales pero además podría dar idea de la forma de la distribución subyacente a los datos [25].
En determinados casos, cuando la variable a estudio resulta no normal, es posible obtener normalidad a través de una transformación de la variable. Para ello se acostumbra emplear la familia de transformaciones de Box-Cox [27], en donde las transformaciones más comúnmente empleadas son el logaritmo neperiano y la raíz cuadrada (disponibles en Epidat 4).
La entrada de datos solo se puede realizar de forma automática. A partir de un archivo que contenga los datos individuales. De manera que, a través del asistente de datos, se selecciona el archivo en cuestión, la hoja en la que se encuentran los datos y dos variables: una variable para resumir (variable numérica) y, opcionalmente, otra variable para segmentar los resultados (variable categórica).
Ejemplo
A partir del archivo SICRI-2010.xls, se estudia la normalidad de la variable TALLA en el caso de los hombres y de la variable PESO para toda la muestra.
Resultados con Epidat 4:
A la vista de los resultados, ambos contrastes (Shapiro-Francia y asimetría y curtosis) permiten concluir que la distribución de la talla para la población de hombres puede ser considerada normal. Esta afirmación coincide con lo que se observa en el gráfico cuantil-cuantil, donde los puntos se sitúan encima de la diagonal lo que indica normalidad en los datos.
En el estudio de la variable PESO, los contrastes de hipótesis y el gráfico cuantil-cuantil llevan al claro rechazo de la hipótesis nula.
Resultados con Epidat 4:
Sin embargo, la transformación logarítmica, permite aceptar la normalidad de la variable transformada.
Bibliografía
1 Fisher RA. Statistical methods for research workers. Edinburgh: Oliver and Boyd; 1925. 2 Neyman J, Pearson A. On the use and interpretation of certain test criteria for purposes of statistical inference. Biometrika. 1928;20:175-240.
3 Armitage P. P value. En: Armitage P, Colton T, editores. Encyclopedia of Biostatistics Vol. 4. Chichester: John Wiley & Sons; 1998. pp. 3233-7.
4 Armitage P, Berry G. Estadística para la investigación biomédica. 2ª ed. Barcelona: Doyma; 1992.
5 Silva LC, Benavides A. El enfoque bayesiano: otra manera de inferir. Gac Sanit. 2001;15(4):341-6.
6 International Committee of Medical Journal Editors [página en Internet]. Uniform requirements for manuscripts submitted to biomedical journals [actualizado Abr 2010; citado Mar 2013]. Disponible en: http://www.icmje.org
7 Dirección Xeral de Saúde Pública. Programa galego de detección precoz de cancro de mama (PGDPCM). Resultados 1992-2009. Consellería de Sanidade 2010.
8 Rosner B. Fundamentals of biostatistics. 5ª ed. Belmont, CA: Duxbury Press; 2000. 9 Fleiss JL. Statistical methods for rates and proportions. New York: John Wiley & Sons; 1981.
10 Gardner MJ, Altman DG. Statistics with confidence: confidence intervals and statistical guidelines. London: British Medical Journal; 1989.
11 Brown LD, Cai TT, DasGupta A. Interval estimation for a binomial proportion. Statistical Science. 2001;16(2):101-33.
12 Clopper CJ, Pearson ES. The use of confidence or fiducial limits illustrated in the case of the binomial. Biometrika. 1934;26(4):404-13.
13 Conover WJ. Practical nonparametric statistics. 2ª ed. New York: John Wiley & Sons; 1980.
14 Silva LC. Cultura estadística e investigación científica en el campo de la salud: una mirada crítica. Madrid: Díaz de Santos; 1997.
15 Levene H. Robust tests for equality of variances. En: Olkin I, Ghurye SG, Hoeffding W, Madow WG, Mann HB, editores. Contributions to probability and statistics: essays in honor
18 Bland M. An introduction to medical statistics. 3ª ed. USA: Oxford University Press; 2000.
19 Sprent P, Smeeton NC. Applied nonparametric statistical methods. 3ª ed. Chapman & Hall/CRC; 2001.
20 Shapiro SS, Francia RS. An approximate analysis of variance test for normality. Journal of the American Statistical Association. 1972;67:215-6.
21 Shapiro SS, Wilk MB. An analysis of variance test for normality (complete samples). Biometrika. 1965;52:591-611.
22 Royston JP. Approximating the Shapiro-Wilk W-test for non-normality. Statistics and Computing. 1992;2:117-9.
23 Royston JP. A pocket-calculator algorithm for the Shapiro-Francia test for non-normality: an application to medicine. Statistics in Medicine. 1993;12:181-4.
24 Gould W, Rogers W. Summary of tests of normality. Stata Technical Bulletin. 1991;3:20-3.
25 D'Agostino RB, Belanger A, D'Agostino RB Jr. A suggestion for using powerful and informative tests of normality. The American Statistician. 1990;44(4):316-21.
26 Royston JP. Comment on sg3.4 and an improved D'Agostino test. Stata Technical Bulletin. 1991;3:23-4.
27 Box GEP, Cox DR. An analysis of transformations. Journal of the Royal Statistical Society. Serie B (Methodological). 1964;26(2):211-52.