Nuclear safety - Annual report 2010 on the European Community’s development policy and the impl

2. IMPLEMENTATION

2.6. Nuclear safety

En el plan de análisis se expone y detalla, de acuerdo a los objetivos propuestos, las medidas de resumen de las variables y cómo serán presentadas (cuantitativas y/o cualitativas), indicando los modelos y técnicas analíticas que se utilizarán para comprobar las hipótesis del estudio

La obtención de los datos cuantitativos ha sido a partir de la información que se recoge en el repositorio de datos (datawarehouse): Metavisión y SAP.

Para el análisis estadístico descriptivo y con el fin de poder generar dichos análisis se crearon “rutinas específicas”174 ad-hoc en Stata 11.2 ("StataCorp. 2009. Stata Statistical Software: Release 11. College Station, TX: StataCorp LP").

Esto ha permitido tener para cada paciente un estudio individual, los promedios y medianas de las variables FC, FR, Saturación y aporte FIO2, así como el tipo de ventilación que ha recibido en función de si el recién nacido estaba en canguro o no. Esta información proviene para cada canguro, de la selección de un periodo anterior y posterior de igual duración que el periodo de tratamiento canguro.

Se ha ilustrado a partir de una representación gráfica de cada variable incluyendo la banda de confort y marcando los valores críticos. Este análisis ha permitido una comparación por medio de la prueba de Kruskal-Wallis de los valores de FC,FR, SAT y FIO2 para analizar dichos períodos.

Adicionalmente, para el tratamiento de la información se ha generado, a partir de un lenguaje de programación, una “subrutina canguro” específica para el estudio con el fin de importar los registros y compilarlos desde Metavision. Consiste en el proceso de compilación y enlazado de información, para diseñar, escribir, depurar y mantener el código fuente en las rutinas de programación creadas “ad hoc” en fichero DBU. El propósito de la programación ha sido para poder hacer modelados y estudios de patrones de información.

El estudio se ha realizado a partir del análisis de la estadística descriptiva: presentación de datos en tablas, gráficos y síntesis de ellos mediante descripciones numéricas, para finalizar las conclusiones con la inferencia estadística. Ésta se relaciona con el desarrollo de métodos y técnicas para obtener, analizar e interpretar datos cuantitativos de tal manera que la confiabilidad de las conclusiones basadas en los datos pueda ser evaluada objetivamente por medio del uso de la probabilidad. Basándonos en la teoría de la probabilidad podremos pasar de datos específicos a conclusiones y su relevancia clínica.

174 Perez-Hoyos, Santi. Ldo en Matemàticas. Doctor en Medicina (Salud Pública). Unitat de Suport Metodològic a la Investigació Biomèdica (USMIB). Vall d'Hebrón Institut de Recerca (VHIR).

Consideramos que a pesar que la inferencia estadística ha adquirido recientemente la importancia que antes tenía la estadística descriptiva, iniciaremos el estudio a partir de la descriptiva para tener una visión general de tema objeto de esta tesis.

Posteriormente a partir de la inferencia estadística trataremos de realizar generalizaciones basadas en muestras de datos. El objetivo es aplicar a problemas como estimar posibilidades de factores preventivos en el desarrollo multicausal de la displasia bronco pulmonar, o por medio de pruebas, como verificar a partir de mediciones efectuadas sobre muestras de una situación de patrón sostenido de canguro (MMC).

Cuando se hace una inferencia estadística, debe procederse con cautela: debe decidirse hasta qué punto pueden hacerse generalizaciones a partir de un conjunto de datos disponibles, si las generalizaciones son razonables, o si sería preferible disponer de otro conjunto de datos. Por este motivo en este estudio hemos optado por esta técnica y sus conclusiones aparecerán en el capítulo de dicha referencia.

Algunos de los problemas importantes de la inferencia estadística se refieren precisamente a la evaluación de los riesgos y las consecuencias a las que uno se exponen al hacer generalizaciones. En este sentido, tomamos los resultados como posible estimación dentro de esta realidad. Hemos optado por el principio de prudencia en la generalización de los resultados, con el fin de evitar la probabilidad de tomar decisiones erróneas, las posibilidades de hacer decisiones incorrectas y de obtener estimaciones no comprendidas dentro de los límites permitidos. Todos estos problemas los aborda la teoría de la decisión, fuera del alcance de esta investigación.

Para la realización del estudio entre la población (universo o totalidad de elementos que se consideran), hemos seleccionado como muestra (subconjunto de una población que se selecciona para su estudio) todos los neonatos que cumplan los criterios de inclusión ingresos en 2011 Hospital Materno Infantil Vall d’Hebron, 72 pacientes con información monitorizada de 3.764.999 registros de 17 variables de información cada uno). En cuanto a las características de la muestra, se ha recogido la situación clínica al inicio del estudio y la homogeneidad basal entre los grupos de estudio (primeros 45 días de vida UCIN según protocolo Neonatos HVdH).

La información obtenida de la muestra resulta muy exhaustiva y carecería de utilidad clínica a menos que sea condensada. Para una mejor comprensión de la información aportada, se ha analizado la posición, la variabilidad y como se distribuyen los datos de las variables y sus categorías, y ésta ha sido expresada por las medidas definidas a continuación:

1. Análisis de tendencia central: Se utilizan en este estudio como medidas de tendencia central o de posición: la media aritmética, rango medio (valor mínimo y máximo) y la mediana (p25 y p75).

a. Media Aritmética: Si bien es una de las medidas más utilizadas posee la desventaja de ser muy afectada por los valores extremos, pues en su cálculo se utilizan todas las observaciones. Puede entonces dar una imagen distorsionada

de la información contenida en los datos, por lo que no siempre es la mejor medida de posición.

b. Mediana: Es el valor que ocupa la posición central en un conjunto de datos, ordenados en forma creciente o decreciente. En este estudio consideramos que la mediana resulta apropiada puesto que el conjunto de datos posee observaciones extremas en toda la monitorización (FR, FC, Sat).

c. Rango Medio: Es la media de las observaciones mayor (Max) y menor (Min). En este estudio permite visualizar los valores de forma adecuada, rápida y sencilla para resumir un conjunto de datos la visión de los extremos del sujeto.

d. Por último, en algunos análisis se ha incluido la moda (valor de un conjunto de datos que aparece con mayor frecuencia y no depende de los valores extremos, pero es más variable) ya que nos aporta información del patrón de sujetos en relación a la variable que analizamos.

2. Análisis de dispersión: Permiten conocer la variabilidad de un conjunto de datos. En el estudio analizamos el rango, varianza, desviación estándar y coeficiente de variación.

a. Rango: Es la diferencia entre las observaciones mayor y menor. Si bien es una medida de dispersión simple. Por la volatilidad de los registros de los sujetos de la muestra y la vulnerabilidad de las primeras semanas de vida de los prematuros <28SG esta información tiene el inconveniente de que no toma en consideración la forma en que se distribuyen los datos entre los valores más pequeños y más grandes, y por tanto se ha desestimado.

b. Varianza: Mide la dispersión "promedio" en torno a la media, es decir cómo fluctúan las observaciones mayores por encima de la media y cómo se distribuyen las observaciones menores por debajo de ella, expresada en unidades cuadradas. Todos los análisis individuales realizados incluyen el cálculo de ANOVA detallado en las pruebas estadísticas.

c. Desviación estándar: También mide la dispersión "promedio" en torno a la media, es decir cómo fluctúan las observaciones mayores por encima de la media y cómo se distribuyen las observaciones menores por debajo de ella, expresado en unidades originales

d. Coeficiente de variación: Es una cantidad que mide la dispersión de los datos con respecto a la media. Medida relativa expresada en porcentaje. Es útil cuando se compara la variabilidad de dos conjuntos de datos, o más, expresados en diferentes unidades. En este caso, permite medir el conjunto de datos de monitorización pre canguro, durante canguro y postcanguro. 3. Análisis de forma: Las medidas de forma describen la manera en que se distribuyen los

datos. Una distribución de datos puede ser simétrica o sesgada (asimétrica). Para indicar la forma se comparan la media y la mediana de la distribución.

a. Si las medidas son iguales se considera que los datos son simétricos, o que la distribución tiene sesgo cero.

b. Cuando la media es > (mayor que) la mediana, el sesgo es positivo o la asimetría es a la derecha. El sesgo positivo ocurre cuando la media se ve aumentada por algunos valores extraordinariamente grandes.

c. Cuando la media es < (menor que) la mediana, se dice que la distribución tiene sesgo negativo o asimetría a la izquierda. el sesgo negativo se da cuando la media se ve afectada por algunos valores extremadamente pequeños.

Para mejorar la legibilidad en el tratamiento de los datos agrupados, se han utilizado las siguientes pruebas estadísticas:

1. La distribución de frecuencias: es una tabla en la que se disponen los datos divididos en grupos y ordenados numéricamente, mostrando también el número de elementos de cada grupo o clase. Se sacrifica así parte de la información contenida en los datos: en aras a poder destacar características importantes de los datos.

2. La distribución acumulada: son formas alternativas de agrupar los datos "menor que" y "mayor que" que se han utilizado para la agrupación de las bandas.

3. La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia. es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria.

4. P-Value: está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido (valor del estadístico calculado) suponiendo que la hipótesis nula es cierta. Es fundamental tener en cuenta que el p- value está basado en la asunción de la hipótesis de partida (o hipótesis nula). Se rechaza la hipótesis nula si el valor P asociado al resultado observado es igual o menor que el nivel de significación establecido, convencionalmente 0,05 ó 0,01. En las distintas tablas cuando aparece este nivel de significación está coloreadas los resultados para facilitar la identificación. Esta diferencia estadísticamente significativa o despreciable no tiene por qué suponer una diferencia clínicamente considerable (médicamente esté o no justificada su presencia) y al revés, como se comentarán en los análisis.

5. la prueba U de Mann-Whitney : es una prueba no paramétrica aplicada a dos muestras independientes que nos ha permitido comparar dos grupos respecto a una variable cuantitativa. Es la versión no paramétrica de la habitual prueba t de Student. Se usa para comprobar la heterogeneidad de dos muestras ordinales cuando: las observaciones de ambos grupos son independientes, son variables ordinales o continuas, cuando bajo la hipótesis nula, las distribuciones de partida de ambas distribuciones es la misma y cuando bajo la hipótesis alternativa, los valores de una de las muestras tienden a exceder a los de la otra: P(X > Y) + 0.5 P(X = Y) > 0.5.

6. ANOVA (analysis of variance). El ANOVA de este factor canguro permite obtener información sobre el resultado de esa comparación. Es decir, permite concluir si los sujetos sometidos a distintos tratamientos canguro (intensivo, moderado, leve, etc) difieren la medida de estabilización utilizada (banda confort). Tendremos una VI categórica (el MMC) cuyos niveles de tratamiento deseamos comparar entre sí, y una VD cuantitativa (las medidas de la monitorización FC, FR, Sat), en la cual queremos comparar los tres momentos (ventanas) temporales antes, durante y después de canguro.

Se ha establecido el nivel de significación estadística para todas las pruebas estadísticas realizadas con las variables de resultados de p=+/-0,05.

Finalmente, los factores de confusión (variables que interfieren en nuestra variable principal, pudiendo afectar a los resultados) se han prevenido en la fase de diseño, aunque no siempre es posible. Hemos identificado un factor de confusión, “estado maternal” en el momento del canguro como factor que potencialmente aparece relacionado con nuestra variable de respuesta (autoregulación del RN) y, a la vez, está asociado con otras variables del estudio que se relacionan con nuestro factor, sin ser una variable intermedia entre estas relaciones. Este estado maternal pudiera influenciar los resultados en la medida que, las condiciones subjetivas de la madre en el momento de iniciar el MMC, pueden condicionar la calidad de la atención sostenida madre–hijo. Para ello hemos desestimado los minutos (en igual proporción) previos y posteriores al momento del canguro (correspondientes al transfer) y a su vez que correlacionan con el tiempo que la madre necesita para conectarse con su RN.

In document Annual report 2010 on the European Community’s development policy and the implementation of external assistance in 2009. Commission staff working document annexed to the report. SEC (2010) 773 final, 28 June 2010 (Page 143-150)