Trustworthiness
Phase 7: Data analysis using MCA
Los algoritmos de regresi´on lineal por m´ınimos cuadrados (kriging simple, kriging ordi- nario, kriging con un modelo de tendencia y kriging de bloque) son modelos de dependen- cia espacial que permiten abordar el problema de la estimaci´on de valores de atributos en lugares no muestreados (Goovaerts, 1997).
Considerando el problema de que se estime el valor de un atributo cont´ınuozen cualquier lugar no muestreado U usando solo z-datos disponibles en el ´area de estudio A, tal que para n datos, tenemos {z(Uα), α = 1, ...n}. Kriging es el nombre gen´erico adoptado por geoestad´ısticos para la familia de algoritmos de regresi´on por m´ınimos cuadradados generalizado, todos los estimadores son m´as que variantes de kriging del estimador de regresi´on lineal b´asica Z∗
(U), definida como Z∗ (U)−m(U) = n(U) X α=1 λα(U)[Z(Uα)−m(Uα)] (3.20)
donde λα(U) es el peso asignado al dato z(Uα) interpretado como una realizaci´on de la variable aleatoria Z(Uα), los cuantiles m(U) y m(Uα) son los valores esperados de las variables aleatorias Z(U) yZ(Uα), el n´umero de datos que intervienen en la estimaci´on, as´ı como sus pesos pueden cambiar de un momento a otro. En la pr´actica solo los n(U) datos m´as cercanos a la localizaci´on U que son estimados pueden ser retenidos, esto es, los datos dentro de una vecindad W(U) centrada en U. La interpretaci´on de los valores desconocidosz(U) y los valores de los datosz(Uα) como realizaciones de variables
aleatoriasZ(U) yZ(Uα) permite definir el error de estimaci´on como una variable aleatoria
Z∗
(U)−Z(U).
Las variantes de participaci´on en el m´etodo kriging tienen el mismo objetivo que consiste en tratar de minimizar estimaci´on o la varianza del error σ2
E(U). Bajo la restricci´on del
estimador insesgado, esto es σ2
E(U) = V ar{Z
∗
(U)−Z(U)} se minimiza con la restricci´on de que
E{Z∗
(U)−Z(U)}= 0 (3.21) El estimador de kriging var´ıa seg´un el modelo adoptado para la funci´on aleatoria Z(U) en s´ı. La funci´on aleatoria Z(U) usualmente suele descomponerse en una componente residual R(U) y un componente de tendencia m(U). El componente residual se modela como una funci´on aleatoria estacionaria con media cero y covarianza CR(h):
E{R(U)}= 0
Cov{R(U), R(U +h)}=E{R(U)·R(U +h)}=CR(h)
El valor esperado de la variable aleatoria Z en la posici´on U es por lo tanto el valor del componente de tendencia en ese lugar:
E{Z(U)}=m(U)
Se pueden distiguir tres variantes de kriging de acuerdo con el modelo considerado por la tendencia m(U)
1. Kriging simple: considera que la media m(U) debe ser conocida y constante a lo largo del ´area de estudio A
m(U) =m
, conocida
∀U ∈A
minio de la estacionalidad de la media para una vecindad local W(U): m(U′
) son constantes desconocidas,∀U′
∈W(U) A diferencia de kriging simple, aqu´ı la media se considera desconocida.
3. Kriging con un modelo de tendencia: considera que el valor de la media local m(U) es desconocido y sin problemas var´ıa dentro de cada vecindad w(U), por lo tanto, el estudio de toda la zona A. El componente de tendencia es modelado como una combinaci´on lineal de funciones fk(U) de las coordenadas
m(U′) = K X k=0 ak(U′ )fk(U′) con ak(U′
) ≈ak constantes pero desconocidas ∀U′
∈W(U) los coeficientes ak(U′
) son desconocidos y considerados constantes en cada vecindad local W(U). Por convenci´onf0(U
′
) = 1, por lo tanto el casoK = 0 es equivalente al kriging ordinario (constante pero de media desconocida a0).
3.11.1.
Kriging simple
Los modelos de la componente de tendencia m(U) conocida como media estacionaria m
nos permite escribir el estimador lineal (3.20) como una combinaci´on lineal de (n(u) + 1) piezas de informaci´on: las n(U) variables aleatoriasZ(Uα) y el valor de media m:
Z∗ SK(U) = n(U) X α=1 λSK α (U)[Z(Uα)−m] +m= n(U) X α=1 λSK α (U)Z(Uα) + 1 + n(U) X α=1 λSK α (U) Los pesos n(U) de λSK
α (U) son entonces determinados para minimizar la varianza del
error σ2
E(U) =V arZ
∗
SK(U)−Z(U) bajo contracciones imparciales. El estimador simple
Kriging (SK) (3.21) es insesgado cuando la media es igual a cero. Utilizando la expresi´on (3.21) tenemos
E{Z∗
SK(U)−Z(U)}=m−m= 0
El error de estimaci´on Z∗
(n(U) + 1) con variables aleatorias residuales R(U) y R(Uα): Z∗ SK(U)−Z(U) = [Z ∗ SK−m]−[Z(U)−m] = n(U) X α=1 λSKα (U)R(Uα)−R(U) =R ∗ SK(U)−R(U) (3.22) donde R(Uα =Z(Uα)−m) yR(U) =Z(U)−m
La varianza del error puede expresarse como una doble combinaci´on lineal de los valores de la covarianza residual: σ2 E(U) =V ar{R ∗ SK(U)}+V arR(U)−2Cov{R ∗ SK(U), R(U)} =Pn(U) α=1 Pn(U) β=1 λSKα (U)λSKβ (U)CR(Uα−Uβ +CR(0)) −2Pn(U) α=1 λSKα (U)CR(Uα−U) =Q(λSK α (U), α= 1, ..., n(U)) (3.23)
La varianza del error (3.23) se describe como una forma cuadr´atica Q(.) en los pesos
n(U) de λSK
α (U) los pesos ´optimos son aquellos que minimizan la varianza del error, son
obtenidos igualando a cero cada una de las primeras derivadas parciales de las n(U)
1 2 ∂Q(U) ∂λSK α (U) = n(U) X β=1 λSK
β (U)CR(Uα−Uβ)−CR(Uα−U) = 0, α= 1, ..., n(U) (3.24)
El sistema (3.24) de n(U) ecuaciones lineales es conocido como el sistema de ecuaciones normales o del sistema Kriging simple. La estacionaridad de la media implica que la funci´on covarianza residual CR(h) es igual a la funci´on de covarianza estacionaria C(h) de las funciones aleatorias Z(U), definida como sigue:
CR(h) =ER(U)R(U+h) = E[Z(U)−m][Z(U +h)−m] =C(h) (3.25)
Por lo tanto, el sistema kriging simple (3.24) puede ser escrito en t´erminos de Z-covarianzas como
n(U)
X
β=1
λSKβ (U)C(Uα−Uβ) = C(Uα−U), α= 1, ..., n(U) (3.26)
imos la expresi´on (3.25) en la definici´on (3.23) de la varianza del error σSK2 (U) = C(0)− n(U) X α=1 λSKα (U)C(Uα−U) (3.27)
3.11.2.
Notaci´on de correlograma
El kriging simple en t´erminos de el correlograma ρ(h), se obtiene dividiendo la ecuaci´on (3.25) por la varianza C(0), esto es, para
n(U)
X
β=1
λSK
β (U)ρ(Uα−Uβ) =ρ(Uα−U)
donde α= 1, ..., n(U)
La varianza SK esta dada por
σSK2 (U) = C(0) 1− n(U) X α=1 λSKα (U)ρ(Uα−U)
3.11.3.
Notaci´on matricional
En notaci´on matricional, el kriging simple de ecuaci´on (3.26) puede escribirse como
KSKλSK(U) =kSK
donde KSK es la matriz de covarianzas de n(U)×n(U)
KSK = C(U1−U1) ... C(U1−UN(U)) . . . . . . . . . C(Un(U)−U1) ... C(Un(U)−Un(U))
desconocidos λSK(U) = λSK 1 (U) . . . λSK n(U)(U) SK(U) = C(U1−U) . . . C(Un(U)−U)
Los pesos que el Kriging requiere para estimar losSKse obtienen multiplicando la inversa de la matriz de covarianza de los datos por el vector de covarianzas de datos desconocidos
λSK(U) = K−1 SKkSK de modo que σ2SK(U) = C(0)−λ T SK(U)kSK =C(0)−k T SKK −1 SKkSK
El sistema de kriging simple (2.19) tiene soluci´on ´unica y la varianza kriging resultante es postitiva si la matriz de covarianza KSK = [C(Uα−Uβ)] es definida positiva, esto es,
• a) Si α6=β entoncesUα 6=Uβ
Prueba de raz´on de verosimilitudes
generalizada para tendencia en la
serie de extremos
4.1.
Prueba Propuesta
Una forma de evaluar la adecuaci´on de un modelo es compararlo con un modelo m´as general con el m´aximo n´umero de par´ametros que pueden ser estimados, llamadomodelo saturado˝. SeanYi coni= 1, ..., N observaciones de valores diversas para el componente lineal XT
i β, decimos que un modelo saturado se puede especificar con N par´ametros,
es decir, un par´ametro por observaci´on esto tambi´en llamado modelo completo˝. Sea
m el n´umero m´aximo de par´ametros que pueden ser estimados, sea βmax el vector de par´ametros del modelo saturado y sea bmax el estimador de m´axima verosimilitud de
βmax .
La funci´on de verosimilitudL(bmax;y) para el modelo saturado evaluado enbmax ser´a m´as grande que ning´un otra funci´on de verosimilitud, porque posee la mas completa descrip- ci´on de los datos. Sea L(b;y) el m´aximo valor de la funci´on de verosimilitud para el modelo de inter´es. Entonces la raz´on de verosimilitud es
λ= L(bmax;y)
L(b;y)
es una alternativa de prueba para ajustes de el modelo. El logaritmo de la raz´on de verosimilitud, es la diferencia las funciones de log-verosimilitud
logλ =l(bmax;y)−l(b;y)
Los valores grandes de logλ sugiere que el modelo de inter´es es una descripci´on pobre de los datos relacionados al modelo saturado. La devianza, es llamada estad´ıstica (raz´on) de log- verosimilitud definida
D= 2 [l(bmax;y)−l(b;y)]
La aproximaci´on por serie de Taylor para una funci´on f(x) de una variable cercana al valor t es f(x) = f(t) + (x−t) df dx x=t +1 2(x−t) 2 d2f dx2 x=t +...
seg´unxse aproxime atPara una funci´on de log-verosimilitud de un s´olo par´ametroβlos primeros tres t´erminos de la aproximaci´on de la serie de Taylor proximo a un b estimado es
l(β) = l(b) + (β−b)U(b) + 1
2(β−b)
2U′
(b) donde U(b) = dβdl es la funci´on evaluada en β =b. Si U′
= dβd2l2 es
l(β) = l(b) + (β−b)U(b)− 1
2(β−b)
2τ(b)
donde τ(b) es la informaci´on evaluada en β =b. La aproximaci´on que corresponde a la funci´on de log-verosimilitud para un vector de par´ametros β es
l(β) =l(b) + (β−b)TU(b)−1
2(β−b)
T
τ(b)(β−b)
donde U es el vector de score y τ es la matriz de informaci´o. Si b es el estimador de m´axima verosimilitud de el par´ametro β, es decir, U(b) = 0.
l(β)−l(b) =−1 2(β−b) T τ(b)(β−b) aproximadamente. La estad´ıstica 2 [l(b;y)−l(β;y)] = (β−b)Tτ(b)(β−b)
tiene distribuci´on chi-cuadradaχ2(p) dondepes el n´umero de par´ametros De el resultado
de la distribuci´on muestral de la devianza
D= 2 [l(bmax;y)−l(b;y)] = 2 [l(bmax;y)−l(βmax;y)]−2 [l(b;y)−l(β;y)]+2 [l(βmax;y)−l(β;y)]
El primer t´ermino tiene distribuci´on χ2(m) donde m es el n´umero de par´ametros en el
modelo saturado. El segundo t´ermino tiene distribuci´on χ2(p) donde p es el n´umero de
par´ametros en el modelo de inter´es. El tercer t´ermino υ = 2 [l(βmax;y)−l(β;y)] es una constante positiva que tiende a cero si el modelo de inter´es ajusta la mayoria de los datos, asi como el modelo saturado. As´ıD∼χ2(m−p, υ)
La devianza es una estad´ıstica que permite comparar dos modelos que necesitan estar anidados, es decir, que tengan la misma distribuci´on de probabilidad y la misma fun- ci´on liga, pero el componente lineal de el modelo m´as simple M0 es un caso especial de
componente lineal que el modelo m´as general M1 Considerando la hip´otesis H0 :β =β0
Para probar la existencia de tendencia en la serie de valores extremos, incluimos al factor tiempo (t) como covariable en los par´ametros de regresi´on asociados a los par´ametros de escala y forma del modelo DGEV.
Sea Yt ∼ DGEV(µ, σ(t), ξ(t)) los valores m´aximos (m´ınimos) anuales tomados en el tiempo (t). La hip´otesis de inter´es es: H0: No hay evidencia estad´ıstica de tendencia
en los par´ametros de regresi´on asociados a los par´ametros de la distribuci´on de valores extremos generalizada Modelo reducido = M0 Y1 ∼DGEV(g −1 (β3), h −1 (β2), k −1 (β1))
H1 : Existencia de evidencia estad´ıstica de tendencia en los par´ametros de regresi´on
asociados a los par´ametros de escala y forma de la distribuci´on de valores extremos generalizada. Modelo completo =M1
Yt ∼DGEV(g−1 (β(3)1), h −1 (β(2)1+β(2)2t), k −1 (β(1)1+β(1)2t))
utilizando la estadistica de prueba
2[l(M1)−l(M0)]∼χ2p1−p0 donde:
a) pi es el n´umero de par´ametros (Mi)
b) l(Mi) es la log-verosimilitud del modelo Mi, con i= 0,1.
Si la hip´otesis nula se rechaza, entonces el modeloM1 es m´as verosimil en ocurrencia que
el modelo M0
4.2.
Potencia de la prueba de raz´on de verosimili-
tudes generalizada para tendencia en la serie de
extremos
En una prueba de hip´otesis H0 vsH1, un error de tipo II ocurre cuando H1 es verdadera
pero H0 no es rechazada. La potencia de una prueba eta dada por la funci´on potencia
π : Θ → [0,1], que es la probabilidad π(θ) de rechazar H0 dado que el verdadero valor
del par´ametro esθ. Seaθ1 ∈Θ1, la probabilidad de cometer el error tipo II es 1−π(θ1).
Idealmente podriamos preferir una prueba de menor probabilidad de error. El error de tipo I (rechazarH0 dado que H0 es verdadera) es controlado por el nivel de significancia
elegido. Menor error tipo II corresponde a potencia alta bajo la hip´otesis alternativa. Cuando comparamos pruebas de algunas hip´otesis con alg´un nivel de significancia nos interesa comparar la potencia de las pruebas. Si la funci´on potencia de la prueba no puede ser derivada anal´ıticamente, la potencia de la prueba comienza con una alternativa fija
θ1 ∈ Θ1 se emplea el m´etodo Monte Carlo, note que la funci´on de potencia es definida
para todoθ ∈Θ pero el nivel de significancia α controla π(θ)≤α para todoθ ∈Θ0.
Monte Carlo es un m´etodo estad´ıstico basado en un muestreo aleatorio para analizar el comportamiento del estimador con datos simulados. Mediante M´etodo Monte Carlo mostramos la sensibilidad de el modelo VGLM para detectar tendencias, como sigue:
1) Fijamos los valores de las pendientes distintas e iguales a cero asociadas a los par´ametros de regresi´on de los par´ametros de la Distribuci´on de Valores Extremos Generalizada (GEV).
2) Generamos n variables aleatorias de GEV.
3) Se agrega a cada una de las n variables aletarias el valor del producto de una pendiente determinada y la variable tiempo (con longitud n).
4) Se ajusta el modelo completo utilizando VGLM a las variables del paso 3). 5) Se ajusta el modelo reducido utilizando VGLM a las variables del paso 3).
6) Se comparan los modelos del paso 4) y 5) con prueba de raz´on de verosimilitudes y se contabiliza las veces que se rechaza la hip´otesis nula.
7) El cociente de los rechazos de la hip´otesis nula y las iteraciones del m´etodo, nos indica la gr´afica de prueba de potencia que se presenta.
Figura 4.1: Prueba de raz´on de verosimilitudes para probar tendencias cuando se utiliza el modelo DGEV, para tama˜no de muestra n= 10,000 ,la potencia fue usando simulaci´on Monte Carlo
Metodolog´ıa propuesta para analizar
datos extremos de variables
meteorol´ogicas
5.1.
Metodolog´ıa Propuesta
La fuente de informaci´on utilizada, en este trabajo es la MAYA v1.0 como consecuencia del an´alisis comparativo con la base de datos CLICOM (Mexico Climatological Station Network Data) del Servicio Meteorol´ogico Nacional. Pasos:
• Se ubican, seg´un coordenadas (longitud, latitud) los 270 nodos de la Maya v1.0 del estado de Durango, que registran la informaci´on diaria de las variables meteorol´ogi- cas (temperatura m´axima (TMAX), temperatura m´ınima (TMIN) y precipitaci´on m´axima (P), en el periodo de 1961-2000.
• Se ordenan la informaci´on de los nodos por fecha y se obtienen los valores extremos (m´aximos, m´ınimos, percentiles), por bloques anuales, seg´un el teorema 1 (Fisher- Tippet-Gnedenko), se distribuyen con DGEV, si se cumplen ciertas condiciones.
• Se usa la libreria de funciones de VGLM del paquete estad´ıstico R (Team, 2012) para ajustar el modelo completo (cuando el tiempo es la variable predictora) donde se supone que la serie es no estacionaria y suponiendo estacionariedad en el modelo
reducido (sin el tiempo como covariable). Los coeficientes de regresi´on del modelo completo, representan el efecto de tendencia en la variable de extremos.
• Se utiliza una prueba de raz´on de verosimilitudes generalizada para probar la estacionariedad, usando la verosimilitud de los modelos completo y reducido. La hip´otesis nula define que no hay evidencia estad´ıstica de tendencia de valores ex- tremos, contrariamente la hip´otesis alternativa define la existencia de evidencia estad´ıstica de tendencia con respecto a los par´ametros de escala y de forma.
• Se estiman los coeficientes de tendencias bajo el modelo VGLM, los cuales, da- do que se obtienen usando el m´etodo de m´axima de verosimilitud, para muestras grandes se distribuyen normalmente por lo se aplica el m´etodo Kriging simple para interpolar las tendencias y se presentan los mapas de tendencia para las variables meteorol´ogicas, utilizando la aplicaci´on ArcGIS 8.1.
5.2.
Descripci´on de la base de datos Maya v1.0
Los datos faltantes en las mediciones de las series de tiempo de variables clim´aticas es un problema fuerte, en el sentido de que, la informaci´on de la base de datos Mexico Cli- matological Station Network Data (CLICOM), que suministra mediciones en estaciones climatol´ogicas tradicionales, es una informaci´on con datos faltantes, debido a diferentes factores tanto en la medici´on, como en situaciones ajenas a nuestro estudio.
Los valores m´aximos ( m´ınimos ) extremos de las variables (temperatura y precipitaci´on), se obtuvieron de la base de datos Maya v1.0, propuesta por el Servicio Meteorol´ogico Na- cional (SMN) de la Comisi´on Nacional del Agua (CONAGUA), a trav´es de la Consultora Nacional de la Organizaci´on Mundial de Meteorolog´ıa, M.C Isabel Quintas, adscrita a la Universidad Aut´onoma Metropolitana (CONAGUA,2011).
La MAYA v1.0 va de la longitud -117.2 ◦ ( 117.2 ◦ W) a la longitud -86.0 ◦ (o 86.0 W) y de la latitud (norte) +14.0 ◦ a la latitud (norte) +33.0◦
. Se trata de una malla de 96 ren- glones por 157 columnas, es decir de 15,072 nodos. Los nodos est´an separados entre s´ı por 0.2◦
en ambas direcciones ortogonales. Por supuesto, muchos de estos nodos caen sobre zonas mar´ıtimas y por ende no tienen su valor definido; 4,542 nodos tienen valor definido al encontrarse sobre tierra y 10,530 no lo tienen por estar sobre el mar. La separaci´on entre nodos equivale en forma burda a aproximadamente 20 km de distancia, es decir se tiene un
valor por cada 400 km2delterritorionacional.Elintervalocubiertoesde40anos, desdeel˜ 1◦
de enero de 1961 hasta el 31 de diciembre de 2000, es decir 14,600 d´ıas. Los d´ıas 29 de febrero de los a˜nos 1964, 1968, 1972, 1976, 1980, 1984, 1988, 1992, 1996 y 2000 no aparecen en la base de datos. La resoluci´on temporal es igual a la original de los datos, diaria. Como en el caso de la base de datos administrada con CLICOM, los d´ıas van de las 8 horas local de un d´ıa a las 8 horas local del d´ıa siguiente. Cada d´ıa se etiqueta con la fecha del cierre del intervalo diario que representa (lo que no coincide en todas las variables con la convenci´on utilizada en CLICOM). Tres de las cinco variables que se miden cuantitativamente en las estaciones climatol´ogicas tradicionales se manejan en MAYA v1.0:
a) Temperatura m´ınima diaria (◦
C) b) Temperatura m´axima diaria (◦
C) c) Precipitaci´on pluvial (mm).
d) Temperatura ambiente a la hora de la lectura (8 horas local) e) Evaporaci´on diaria.
El algoritmo de interpolaci´on con el que se realiz´o dicha malla regular es el promedio pesado de los valores en las estaciones vecinas con pesos proporcionales al inverso del cuadrado de la distancia de cada estaci´on al nodo en cuesti´on. Se utilizaron un m´aximo de las 24 estaciones vecinas m´as cercanas manteniendo el m´ınimo n´umero de estaciones que producen un valor nodal en 5 estaciones vecinas. La b´usqueda de las 24 estaciones vecinas se realiza en cuatro cuadrantes alrededor del nodo (NW, NE, SW, SE) con hasta 6 estaciones en cada cuadrante. El proceso de interpolac´on suaviza el campo de la variable y rasura los picos de su distribuci´on geogr´afica.
La base de datos interpolada en malla regular presenta las siguientes ventajas con respecto a la original de mediciones puntuales:
a) Los nodos tienen un valor para cada d´ıa, no existen huecos; el valor representa la mejor estimaci´on posible de la variable en dicho nodo, dadas las mediciones disponibles y para el algoritmo de interpolaci´on utilizado.
b) La velocidad de procesamiento es mucho mayor que en el caso de los datos medidos en las estaciones puntuales originales.
Figura 5.1: N´umero de estaciones ECT’s utilizadas para el calculo de los valores nodales
Figura 5.2: Distancias promedio de ECT’s al nodo calculado
c) La velocidad de procesamiento es tal que, a´un cuando se tenga inter´es solamente en una cierta regi´on (digamos una cuenca) los c´alculos se pueden realizar a nivel nacional y hasta el final recortar el resultado al interior del rect´angulo o interior del contorno irregular de inter´es.
Limitaciones de la MAYA v1.0:
a) Los valores nodales interpolados fueron obtenidos directamente de los datos de CLI- COM sin controles de calidad adicionales. Algunos de los valores nodales pueden estar contaminados por valores medidos puntuales incorrectos. A´un as´ı, salvo ex- cepciones, el efecto de una sola estaci´on incorrecta debe ser relativamente menor, pero por lo mismo, la identificaci´on de datos obviamente equivocados se hace m´as dif´ıcil.
b) El algoritmo de interpolaci´on utilizado no considera la anisotrop´ıa que podr´ıa provenir del relieve topogr´afico, es decir, s´olo considera cualquier valor vecino en forma independiente a que su altitud sobre el nivel del mar sea m´as o menos pare- cida a la del nodo en cuesti´on.
c) En efecto, los valores m´aximos y m´ınimos medidos se ven suavizados en cierto gra- do, y son dif´ıciles de evaluar de los datos nodales. En aplicaciones que esta suavidad afecta significativamente el resultado, se debe recurrir a los datos puntuales origi- nalmente medidos en la base de datos administrada con CLICOM.
d) La franja costera y la franja aleda˜na a las fronteras internacionales pueden contener datos sesgados hacia las mediciones en el interior del pa´ıs, pues en ellas el resultado nodal puede ser el resultado de una interpolaci´on en solo un hemisferio (o menos) alrededor del nodo.
a) Analizamos las observaciones diarias de las variables meteorol´ogicas (temperatura m´axima, temperatura m´ınima y precipitaci´on), en 270 nodos que conforman el estado de Durango, en el periodo de 1961-2000.
b) Obtenemos los valores m´aximos anuales y aplicamos VGLM en modelo completo (cuando el tiempo es variable predictora) y VGLM en modelo reducido.
c) Comparamos utilizando prueba de raz´on de verosimilitud, los modelos completo y reducido, con la hip´otesis nula que no hay evidencia estadistica de tendencia contra