• No results found

Image-based shape reconstruction

Chapter 5. Unsupervised learning through one-shot image-based shape

5.2.2 Image-based shape reconstruction

Nerlove (1964) y Granger (1969) fueron los primeros investigadores en aplicar el analisis espectral a las series de tiempo en economía.

Engle (1974), demostró que una regresión realizada con las series transformadas en el dominio de la frecuencia, Regresión Band Spectrum (RBS), no alteraba los supuestos básicos de la regresión clásica, cuyos estimadores eran Estimadores Lineales, Insesgados y Optimos (ELIO).

y= Xβ + u (1)

donde X es una matriz nxk de observaciones de k variables independientes, β es un vector kxI de parámetros,

y es un vector nx1 de observaciones de la variable dependiente, y u en un vector nxI de pertubacciones de

media cero y varianza constante, σ2.

El modelo se expresaría en el dominio de la frecuencia aplicando una transformación lineal a las variables dependiente e independientes, por ejemplo, premultiplicando todas las variables por la matriz ortogonal W . La técnica de la RBS consiste en realizar el analisis de regresión en el dominio de la frecuencia, pero omitinedo determinadas oscilaciones periodicas. Con este procedimiento pueden tratarse problemas derivados de la estacionalidad de las series o de la autocorrelación en los residuos. Engle (1974) muestra que si los residuos están correlacionados serialmente y son generados por un procieso estacionario estocástico, la regresión en el dominio de la frecuencia es el estimador asintóticamente más eficiente de β.

La transformación de la ecuación (1) del dominio del tiempo al dominio de la frecuencia en Engle (1974), a partir de la matriz W (Ver Análisis Espectral), cuyo elemento (t, s) esta dado por:

wts= √1 ne iλts s= 0, 1, ..., n − 1 donde λt= 2πnt, t = 0, 1, ..., n − 1, y i = √ −1.

Premultiplicando las observaciones de x y por W (ver apartado), obtenemos: ˙y = ˙Xβ+ ˙u (2)

donde ˙y = W y, ˙X = W X,ç y ˙u = W u.

Si el vector de las perturbaciones en (1) cumple las hipótesis clásicas del modelo de regresión: E[u] = 0 y

E[uu0] = σ2I

n, entonces el vector de perturbaciones transformado al dominio de la frecuencia, ˙u, tendrá las

mimas propiedades.

Por otro lado, dado que la matriz W es ortogonal, W WT = I, entonces WT sería la transpuesta de la

completa conjugada de W , de forma que las observaciones del modelo (2) acaban conteniendo el mismo tipo de información que las observaciones del modelo inicialmente planteado.

var( ˙u) = E( ˙u ˙uT) = E(W uu0WT) = W E(uu0)WT = σ2WΩWT

si Ω = I entonces var( ˙u) = σ2I.

Asuminendo que x es independiente de u, el toerema de Gauss-Markov implicaría que: ˆβ = ( ˙x0˙x)−1˙x0˙y

es el mejor estimador lineal insesgando (ELIO) de ˙β. El estimador obtenido sería de hecho idéntico al estimador MCO de (1).

Estimar (2) manteniendo únicamente determinadas frecuencias, puede llevarse a cabo omitiendo las observa- ciones correspondientes a las restantes frecuencias, si bien, dado que las variables en (4) son complejas, Engle (1974) sugiere la transformada inversa de Fourier para recomponer el modelo estimado en términos de tiempo.

Ejemplo 9

Utilizando el IPI de Cantabria se comprueba que los estimadores MCO coinciden con los estimadores de la regresión en el dominio de la frecuencia:

# DATOS IPI CANTABRIA

library(descomponer) ##

## Attaching package: 'descomponer'

## The following objects are masked _by_ '.GlobalEnv': ##

## cdf, gdf, gdt, gperiodograma, gtd, MW, periodograma, td data("ipi")

t=seq(1:length(ipi))

t2=t^2

# REGRESIÓN MINIMO CUADRADA

summary(lm(ipi~t+t2)) ## ## Call: ## lm(formula = ipi ~ t + t2) ## ## Residuals:

## Min 1Q Median 3Q Max

## -42.468 -4.931 2.215 6.942 23.111 ##

## Coefficients:

## Estimate Std. Error t value Pr(>|t|)

## (Intercept) 95.2675702 2.9250060 32.570 < 2e-16 *** ## t 0.3413570 0.0906335 3.766 0.00024 *** ## t2 -0.0025658 0.0005892 -4.355 2.5e-05 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ##

## Residual standard error: 11.7 on 145 degrees of freedom ## Multiple R-squared: 0.1331, Adjusted R-squared: 0.1212 ## F-statistic: 11.14 on 2 and 145 DF, p-value: 3.169e-05

# TRANSFORMACION SERIES AL DOMINIO DE LA FRECUENCIA

K <- c(rep(1,length(ipi))) ipi.1 = gdf(ipi)

t.1=gdf(t) t.2=gdf(t2) K.1=gdf(K)

# REGRESIÓN EN EL DOMININO DE LA FRECUENCIA

## ## Call:

## lm(formula = ipi.1 ~ 0 + K.1 + t.1 + t.2) ##

## Residuals:

## Min 1Q Median 3Q Max

## -60.195 -5.415 -0.469 2.552 65.236 ##

## Coefficients:

## Estimate Std. Error t value Pr(>|t|) ## K.1 95.2675702 2.9250060 32.570 < 2e-16 *** ## t.1 0.3413570 0.0906335 3.766 0.00024 *** ## t.2 -0.0025658 0.0005892 -4.355 2.5e-05 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ##

## Residual standard error: 11.7 on 145 degrees of freedom ## Multiple R-squared: 0.9872, Adjusted R-squared: 0.987 ## F-statistic: 3739 on 3 and 145 DF, p-value: < 2.2e-16

Definiendo una matriz A de tamaño n x n de ceros excepto en las posiciones de la diagonal principal, correspondientes a las frecuencias que queremos incluir en la regresión, y premultiplicando ˙y y ˙X por A

eleminamos determindas observaciones y las reemplazamos por ceros para realizar la regresión band spectrum. Devolver al dominio del tiempo a estas observaciones requiere:

y= WTA˙y = WTAW y x= WTA˙x = WTAW x (3)

Al regresar ysobre xobtenemos un β idéntico al estimador que obtendríamos al estimar por MCO ˙y frente

a ˙x.

Cuando se realiza la regresión band spectrum de esta manera, ocurre un problema asociado a los grados de libertad de la regresión de ysobre xque asumen los programas estadisticos convencionales, n − k. Los

grados de libertad reales serían únicamente n0− k, donde n0 es el numero de frecuencias incluidas en la

regresión band spectrum.

Tan H.B and Ashley R (1999), señalan que el procedimiento de elaboración de una RBS consta de tres etapas: 1.- Transformar los datos originales del dominio del tiempo al dominio de la frecuencia utilizando series finitas de senos y cosenos. Implicaría premultiplicar los datos originales por la matriz ortogonal W sugerida por Harvey (1978).

2.- Permitir la variación a través de m bandas de frecuencia usando variables Dummy D1

j, ..Dmj . Estas

variables se elaboran a partir de submuestras de las n observaciones del dominio de frecuencias. De esta forma, Ds

j = ˙xj,ksi la observación j está en la banda de frecuencias s y Dsj = 0, en el resto de los casos.

3.- Re-estimar el resultado del modelo de regresión en el dominio del tiempo con las estimaciones y los coeficientes de las m variables Dummy. Implicaría premultiplicar la ecuación de regresión ampliada por las variables Dummy por la transpuesta de W .

Asumiendo entonces que las series, yt, xt, βty utpueden ser transformadas en el dominio de la frecuencia: yt= ηy+ N X j=1 [ay jcos(ωj) + byjsin(ωj)

xt= ηx+ N X j=1 [ay jcos(ωj) + b y jsin(ωj)] βt= ηβ+ N X j=1 [aβ j cos(ωj) + bβjsin(ωj)]

Premultiplicando por W obtenemos:

˙y = ˙x ˙β + ˙u (4) donde ˙y = W y, ˙x = W x, ˙β = W β y ˙u = W u

El sistema (4) puede reescribirse como:

˙y = W xtInWT ˙β + WInWT˙u

Si denominamos ˙e = W InWT˙u, podrían buscarse los ˙β que minimizaran la suma cuadrática de los errores et= WT˙e.

Una vez encontrada la solución a dicha optimización, se transformarían las series al dominio del tiempo para obtener el sistema (6).

Para obtener una solución a la minimización de los errores que ofrezca el mismo resultado que la regresión lineal por mínimos cuadrados ordinarios, requiere utilizar una matriz de regresores cuya primera columna sería el vector de tamaño N, (1, 0, 0, ...), la segunda columna sería la primera fila de la matriz W INXtWT, y

las columnas siguientes, corresponderían las a las frecuencias de senos o cósenos que queremos regresar. Denominando a esta nueva matriz, de tamaño (Nxp), ˙X, donde p = 2 + j, siendo j las frecuencias de seno y

coseno elegidas como explicativas, los coeficientes de la solución MCO serían: ˙β = ( ˙X0X˙)−1X˙0˙y

donde β0,1 sería el parámetro asociado a la constante, β1,1 el asociado a la pendiente, y β1,j los asociados a

las frecuencias de senos y cósenos elegidas.

Ejemplo 10

La regresión en el dominio de la frecuencia para el IPI de Cantabria realizado con un filtrado de altas frecuencias, se muestra aqui:

# CREAMOS LA MATRIZ DE REGRESORES FILTRANDO LAS ALTAS FRECUENCIAS CON LA MATRIZ DE HARVEY

n=length(ipi) M <- MW(length(ipi)) z <- lm(ipi~t+t2)$fitted cx <- M%*%diag(z) cx <- cx%*%t(M) id <- seq(1,n) S1 <- data.frame(cx) S2 <- S1[1:(2+(n/12)),] X <- as.matrix(S2) X <- t(X)

# REGRESION FILTRANDO LAS ALTAS FRECUENCIAS rbs.fit=lm(ipi.1~0+X) summary(rbs.fit) ## ## Call: ## lm(formula = ipi.1 ~ 0 + X) ## ## Residuals:

## Min 1Q Median 3Q Max

## -60.204 -4.326 -0.237 1.651 65.231 ##

## Coefficients:

## Estimate Std. Error t value Pr(>|t|) ## X1 12.16502 0.10704 113.646 < 2e-16 *** ## X2 -0.01543 0.10793 -0.143 0.8865 ## X3 0.16244 0.10615 1.530 0.1283 ## X4 0.06540 0.10725 0.610 0.5430 ## X5 -0.44072 0.10683 -4.125 6.46e-05 *** ## X6 -0.05344 0.10711 -0.499 0.6186 ## X7 0.26225 0.10697 2.452 0.0155 * ## X8 0.19221 0.10706 1.795 0.0748 . ## X9 -0.12187 0.10701 -1.139 0.2568 ## X10 -0.08563 0.10703 -0.800 0.4251 ## X11 0.03593 0.10702 0.336 0.7376 ## X12 0.05775 0.10698 0.540 0.5902 ## X13 0.05649 0.10685 0.529 0.5979 ## X14 -0.04020 0.10680 -0.376 0.7072 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ##

## Residual standard error: 10.86 on 134 degrees of freedom ## Multiple R-squared: 0.9898, Adjusted R-squared: 0.9888 ## F-statistic: 932.6 on 14 and 134 DF, p-value: < 2.2e-16

plot(ts(ipi,frequency = 12, start = c(2002, 1)),type="l",main="IPI.Cantabria",ylab="") lines(ts(lm(ipi~t+t2)$fitted,frequency = 4, start = c(1980, 1)),type="l",col=2)

lines(ts(gdt(rbs.fit$fitted),frequency = 4, start = c(1980, 1)),type="l",col=3)

IPI.Cantabria