Interim Analysis and Stopping Guidelines - STATISTICAL CONSIDERATIONS 1 Study Overview

5. STATISTICAL CONSIDERATIONS 1 Study Overview

5.4. Interim Analysis and Stopping Guidelines

4.4.3.1. Estudio 1. Seroprevalencias, distribución y factores de

riesgo asociados a la exposición a C. burnetii en ganado

ovino de Castilla y León

En primer lugar, se evaluó la posible asociación entre las características potencialmente relacionadas con los resultados serológicos a nivel de explotación (aptitud productiva, tipo de producción y momento de muestreo). Para ello se empleó el testchi-cuadrado seguido de un test Z de comparaciones múltiples ajustado por el método de Bonferroni en el caso de las variables con más de dos categorías. En el caso de la variable momento de muestreo, inicialmente esta se categorizó en trimestres cada año (enero - marzo, abril - junio, julio - septiembre y octubre - diciembre), sin embargo, dado que el número de muestreos en cada trimestre dentro de cada año estaba muy poco balanceado, se exploró la fusión de varias de estas categorías y finalmente se establecieron dos únicas categorías, primer y segundo trimestre del año, de acuerdo a las cuales se llevó a cabo el análisis de dicho factor de riesgo.

Por otro lado, también se comparó el número de ovinos positivos en cada explotación en función de las citadas variables de rebaño mediante el empleo del test de Mann-Whitney en el caso de la aptitud productiva, tipo de producción y época de muestreo y mediante el test de Kruskal-Wallis realizando un ajuste post hoc mediante el método de Bonferroni. Además, también se evaluó la posible existencia de diferencias entre el número de pequeños rumiantes por municipio a lo largo de los cuatro años de estudio mediante el test de Friedman.

Posteriormente, para evaluar la asociación entre las características de rebaño y la probabilidad de encontrar un ovino seropositivo en una determinada granja controlando por la posible dependencia espacial de los resultados, se diseñó un modelo mixto binomial Bayesiano para cada uno de los cuatro años de estudio (2009-2012). Según este modelo, se asumió que el número de ovinos seropositivos muestreados en una determinada explotación i dentro de un determinado municipio j _, se distribuía de acuerdo a una distribución binomial, de modo que:

Donde _, indica la probabilidad que los animales de una determinada granja i perteneciente a un municipio j tienen de ser seropositivos, y _, indica el número de animales testados en dicha granja.

La probabilidad específica de obtener resultados positivos en una determinada granja

, es una una función de k covariables a nivel de rebaño y un factor aleatorio de rebaño

. El posible efecto espacial, derivado del efecto de factores de riesgo conocidos y desconocidos se incluyó en el modelo mediante un efecto de municipio tal como se representa a continuación:

1 _, ⋯

Donde representa la constante origen y , … , son los coeficientes asociados con las variables a nivel de rebaño observadas en una granja i de un municipio j, y representa el efecto espacial para un determinado municipio j.

Las variables a nivel de rebaño que fueron incluyéndose alternativamente en el modelo fueron el censo (categorizado en cuartiles), el tipo de producción (carne vs. leche), la época de muestreo (no disponible para los muestreos realizados durante el año 2010) y el tipo de manejo (extensivo vs. intensivo/mixto). el análisis de esta última variable se llevó a cabo fusionando las categorías de producción intensiva y mixta para compararlas frente a las de producción exclusivamente de extensivo, debido a que el número de explotaciones de tipo intensivo era sensiblemente inferior al de las otras dos categorías (135, frente a una media de 700 de extensivo y 1126 de tipo mixto).

La fuerza de la asociación entre una determinada variable y el resultado del modelo fue estimada utilizando probabilidades Bayesianas a posteriori (PBAP) (proporción de simulaciones de Monte Carlo en las cuales el valor estimado para fue mayor que cero) (Álvarez et al., 2015).

El efecto espacial recibió en un primer análisis una estructura espacial autocorrelacionada, de modo que se asumió que seguía una distribución normal:

Donde ∅ representa una media ponderada del efecto aleatorio _,…, estimado en los k municipios vecinos (limítrofes) al municipio i y representa la precisión (inverso de la varianza) de la distribución de efectos . No obstante, cuando solo se tuvieron en cuenta variables de explotación y efectos aleatorios espaciales a nivel de municipio correlacionados siguiendo un modelo condicional autorregresivo (modelo intrínseco) (Besag et al., 1991), se observó un problema con las estimaciones posteriores de estos últimos: los valores en ciertos casos se vieron muy afectadas por el número de municipios vecinos de un determinado municipio, por una parte, y por el número de explotaciones muestreadas en los mismos, por otra. Cuando el número de municipios vecinos y el número de explotaciones muestreada (en el municipio en cuestión y sus vecinos) era pequeño (n ≤ 2) las estimaciones posteriores de fueron muy superiores a las registradas en el resto de las unidades en estudio, debido a la ausencia de información para una estimación más precisa de las mismas. Dado que expresan un riesgo asociado con variables con una estructura espacial (ya que el valor en el municipio i se ve influido por el de todos sus vecinos) no incluidas en el modelo, para resolver este problema en una segunda fase se exploró la utilidad de añadir variables medidas a nivel de municipio potencialmente relacionadas con la distribución del patógeno tales como el número y densidad de pequeños rumiantes (animales y rebaños) presentes en el mismo. De esta forma el término fue reemplazado por un efecto de municipio modelado a su vez según una distribución normal con media y desviación estándar , siendo una función de las variables de municipio y el efecto aleatorio espacial autocorrelacionado , tal que:

~ ,

De modo que representa el coeficiente asociado con la variable . Como variables a nivel de municipio se exploraron alternativamente el número y la densidad de pequeños rumiantes y de rebaños de estos.

Para los coeficientes … y se usaron distribuciones normales no informativas con media 0 y varianza 1000. Al efecto aleatorio a nivel de explotación se le asignó una distribución normal con media 0 y precisión . Los parámetros y fueron modelados de acuerdo a una distribución Gamma (0,01; 0,01), mientras que para la desviación estándar del efecto a nivel municipio se eligió una distribución uniforme (0; 100).

Con objeto de acomodar la variabilidad observada en los datos, se exploró la utilización de distribuciones beta-binomial y binomial negativa en sustitución de la binomial.

Los modelos fueron ajustados con WinBUGS 1.4.3 a través del paquete R2WinBUGGS (Sturtz et al., 2005) del programa R 3.2.0 (R development core team, 2015). Los modelos fueron evaluados mediante 7000 iteraciones de Monte Carlo vía tres cadenas de Markov con valores iniciales dispersos, muestreando una de cada diez iteraciones para eliminar la autocorrelación. Del total de iteraciones se descartaron las primeras 2500 (burn-in). La convergencia y la mezcla de las cadenas fueron evaluadas visualmente y de forma más formal mediante el empleo del estadístico de Gelman-Rubin (Brooks y Gelman, 1998; Gelman y Donald, 1992). El modelo final se seleccionó en función del DIC (Deviance

Information Criteria) (Spiegelhalter et al., 2002), y el ajuste del modelo se evaluó utilizando

el método de comprobación predictiva (predictive checking), basado en la comparación de un conjunto de datos replicados generados a partir de las distribuciones posteriores de los coeficientes estimados en el modelo, con los datos observados siguiendo un método descrito previamente (GelmanyHill, 2007). En caso de valores de DIC equivalentes (< 5 unidades de diferencia) se priorizaron aquellos modelos que incluían variables potencialmente asociadas con la variable respuesta (indicado por valores de PBAP > 80%). La posible existencia de autocorrelación en la variabilidad residual de los modelos finales se evaluó mediante el test de Moran (Moran, 1950).

4.4.3.2. Estudio 2. Seroprevalencias, distribución y factores de

riesgo asociados a la exposición a C. burnetii en ganado

bovino de la Comunidad de Madrid

Para determinar los posibles factores de riesgo asociados a la detección de casos positivos a fiebre Q en el test ELISA se utilizaron modelos a nivel individual y de rebaño. En primer lugar, se evaluaron las posibles asociaciones entre las características de rebaño e individuales que podían estar potencialmente relacionadas con los resultados serológicos en modelos univariables. Para ello se empleó el test chi-cuadrado en el caso de las variables categóricas y el análisis de la varianza (ANOVA) para las variables continuas una vez evaluada su normalidad. El tamaño de rebaño, la edad y el número de movimientos fueron analizados como variables continuas, aunque el efecto de la edad también fue evaluado categorizando la variable en cuartiles. Dados los resultados obtenidos en el análisis espacial (sección 5. 1. 2.), el estatus del rebaño más cercano (positivo/negativo) también fue incluido en el análisis univariable a nivel de rebaño.

Para la identificación de factores de riesgo asociados con resultados serológicos positivos a nivel individual únicamente se tuvieron en cuenta los resultados de rebaños positivos (n = 330).

Las variables en las cuales se detectó una posible asociación (p ⩽ 0,25) en los modelos univariables fueron incluidas como potenciales predictores (efectos fijos) en los correspondientes modelos multivariables de regresión logística a nivel individual o de rebaño, de la siguiente forma:

Individual: log

1 ⋯

Rebaño: log

1 , ⋯ ,

Donde _, indica la probabilidad que los animales de una determinada granja i perteneciente a un municipio j tienen de ser seropositivos. representa la constante origen y , … , son los coeficientes asociados con las variables a nivel individual en la primera ecuación y a nivel de rebaño observadas en una granja i de un municipio j en la segunda.

En el modelo a nivel de rebaño se exploró el efecto de la inclusión de la delegación como posible efecto aleatorio ( , mientras que el factor aleatorio rebaño se incluyó en el modelo a nivel individual en todos los casos. El modelo final se construyó mediante un proceso de eliminación de pasos hacia atrás (backward stepwise elimination) aplicando un p-valor de 0,05 para la inclusión en el modelo y 0,10 para su exclusión. Debido a que la evaluación de un gran número de iteracciones puede dar lugar a la identificación de asociaciones falsas (Dohoo et al., 2003), solo se tuvieron en cuenta las iteracciones de segundo nivel cuya asociación con los resultados serológicos se hubiera identificado previamente en otros estudios o tuviera un sentido biológico, seleccionando aquellas en las que se identificaba un p-valor < 0,05.

La selección entre varios posibles modelos finales anidados y no anidados se realizó mediante pruebas de verosimilitud (likelihood ratio test) y la comparación del criterio de información de Akaike (Akaike Information Criteria, AIC), respectivamente. La bondad de ajuste del modelo final fue evaluada mediante el test de Hosmer y Lemeshow (Hosmer y Lemeshow, 1989). Todos los análisis estadísticos fueron llevados a cabo mediante el

programa R (R development core team, 2011) y la evaluación del modelo de efectos mixtos se realizó utilizando el paquete Ime4 en R (Bates et al., 2011).

4.4.3.3. Estudio 3. Seroprevalencias, distribución y factores de

riesgo asociados a la exposición a C. burnetii en pequeños

rumiantes de la Comunidad de Madrid

En este estudio, con el fin de identificar aquellos factores de riesgo asociados con la obtención de resultados positivos a fiebre Q en el test ELISA se desarrollaron modelos epidemiológicos a nivel individual y de rebaño siguiendo la misma metodología descrita para el estudio 2.

In document BMT CTN PROTOCOL 0202 VERSION 4.0. Study Co-Chairpersons Ginna Laport, M.D. 1 Robert Negrin, M.D. 1. Protocol Team (Page 54-59)