Which of the following examples is NOT a correctly designed multiple-baseline study? (Higher)

El an álisis de diferencia de im ágenes es una técnica que compara directamente dos im áge- nes de la misma porci ón del cielo en distintos momentos. Es usual que una de ellas sea una

co-adici ónde varias im ágenes tomadas previamente, y que posea una alta relaci ón se ñal/ruido conocida comoimagen de referencia (R). La otra im ágen ser´ıa la recientemente adquiridanue- va imagen (N). Ambas im ágenes se asumen astrométricamente alineadas, y de esta forma se realiza una resta para obtener candidatos a eventos de variabilidad transitoria. Esta sustrac- ci ón de im ágenes no debe ser tomada a la ligera, ya que es necesario resolver una transformaci ón de las propiedades fotométricas de R y N, para as´ı poder realizar una comparaci ón adecuada.

Las diferencias involucradas pueden llegar a ser de diversa ´ındole, y entre las m ás impor- tantes se destacan la variaci ón de la PSF, la variaci ón del fondo del cielo, diferentes respuestas instrumentales, o diferentes relaciones de se ñal/ruido. A veces también pueden estar involucradas distorsiones locales de las im ágenes, como ser las provenientes de la curvatura de campo, o aberraciones crom áticas, de coma, o incluso casos de instrumento fuera de foco, entre otras.

2.3.1. Modelos con kernel linealizado

La resta de im ágenes se remonta a Phillips & Davis (1995) donde se plantea la ecuaci ón 2.9, que conecta la imagen nueva y la referencia en una dada posici ón (x, y). Esta conexi ón es por medios de una deconvoluci ón con unkernel (Ker(u, v)), ligado directamente al cambio de forma de la PSF entre ambas im ágenes. Una soluci ón directa de esto mismo podr´ıa llegar a ser la ecuaci ón 2.10, la cual despeja el valor del kernel en el espacio de Fourier.

R(x, y)_∗Ker(u, v) =N(x, y) (2.9)

Ker= Nb

R (2.10)

Sin embargo este tipo de estrategia sufre de inestabilidad numérica. Es muy frecuente que ocurra una divisi ón por n úmeros peque ños, causado por el denominador de esta ecuaci ón, el cual puede aproximarse a cero m ás r ápido que el numerador. Un ejemplo de un caso donde esto ocurre, es cuando la PSF de la imagen N es fortuitamente m ás estrecha que la PSF de

R. Adem ás en casos donde no exista una virtual divisi ón por cero es posible que la operaci ón amplifique los ruidos propios de las im ágenes causando distorsiones de baja frecuencia, y también anillos de alta frecuencia.

Una soluci ón directa del kernel de deconvoluci ón, como la planteada, puede llegar a ser innecesaria. En cambio, plantear una expansi ón deKeren funciones base es posible, utilizan- do como suposici ón fuerte que en una dada serie de im ágenes a sustraer la forma funcional de Ker ser á estable, y bien modelable por funciones anal´ıticas. Esta estrategia se denomina

2.3. Un candidato paraΓ: An ´alisis de diferencias de im ´agenes

Modelo de Alard-Lupton

El modelo de kernel linealizado se desarrollo en detalle por Alard & Lupton (1998), donde se plantea una descomposici ´on en funciones base Bi(x, y): Ker =PikiBi(x, y), donde ki son

los coeficientes. Esto, al incluirlo en la ecuaci ´on 2.9 tendremos (R_∗Ker)(x, y) =X i kiR(x, y)∗Bi(x, y)≡ X i kiCi(x, y) (2.11)

. Para hallar los coeficientes correctos se aplica la metodolog´ıa de cuadrados m´ınimos, defi- niendo una funci ´on costoQ:

Q= Z [N₋(R_∗Ker)]2/σ2dxdy (2.12) = Z " N₋X i kiCi #2 /σ2dxdy (2.13)

dondeσ(x, y)2_{es la varianza del valor de los p´ıxeles. En este caso, se aproxima la distribuci ´on}

de los valores de los p´ıxeles como distribuciones Gaussianas, en lugar de distribuciones Pois- son (tal como el proceso del conteo discreto de las cuentas de los p´ıxeles sugiere), teniendo entonces σ(x, y) ∝ pN(x, y). Aplicando la ecuaci ón b ásica de minimizaci ón de funciones, e igualando a cero tendremos:

∂Q ∂ki = 2 Z  N₋X j kjCj  Ci/σ2dxdy= 0 (2.14)

Esto es igual a tener la siguiente relaci ´on:

X j kj Z Ci Cj/σ2dx dy= Z N Ci/σ2dxdy (2.15)

la cual puede expresarse como una ecuaci ´on matricial

X j Mijkj=bi (2.16) Mij = Z Ci(x, y)Cj(x, y)/σ2 dxdy (2.17) bi= Z N(x, y)Ci(x, y)/σ2 dxdy. (2.18)

Este modelo de kernel linealizado es extremadamente útil, ya que invirtiendo el sistema de ecuaciones de la Eq. 2.16 podemos obtener una serie de coeficientes que describan a la transformaci ón para escribirNen términos deR. El elemento faltante aqu´ı es la especificaci ón de las funciones base a utilizar.

La primer descomposici ´on propuesta fue una suma de funciones Gaussianas, moduladas por un polinomio de orden bajo (u(x), v(y)), como la Eq. 2.19. Estos polinomios representan suaves modificaciones de la PSF a lo largo del campo de la imagen, variando la importancia de cada funci ´on base de manera local.

Bi(x, y) =e−(x

2_+y2_)/2σ

i _u

Este modelo es adecuado en el caso de una PSF dominada por turbulencia atmosférica, ya que todas las componentes ser án funciones Gaussianas, de distinta extensi ón. Es adem ás de lidiar con distorsiones de campo de menor orden, por ejemplo curvatura de campo en el borde de la imagen, sin perder precisi ón significativamente.

Sin embargo este modelo no es lo suficientemente vers ´atil en todos los casos, y no es capaz de representar PSFs con estructuras complejas. Por ejemplo en el caso de PSFs que no llegan a estar bien muestreadas espacialmente, ya sea por una escala de placa demasiado grande, o por un FWHM excepcionalmente estrecho. Otro caso donde es posible encontrar errores de modelado de la PSF es el caso de una imagen ligeramente fuera de foco, ensanchando el centro del perfil de PSF, dif´ıcil de reproducir con Gaussianas. En cualquiera de los casos anteriores las substracciones de im ´agenes con este tipo de metodolog´ıa puede presentar artefactos.

Adem ás de lo mencionado, el método provee una forma de ajustar la diferencia de fondo de cielo, pero no es un elemento cr´ıtico del método, ya que esto puede ser sustra´ıdo de manera independiente, durante el pre-procesado de las im ágenes a tratar. Esta metodolog´ıa sin embargo, no es capaz de determinar el n úmero de funciones base a utilizar, ni tampoco su tama ño. Ambos par ámetros deben ser obtenidos de forma emp´ırica previamente.

Un detalle del método, que no hemos tenido en cuenta es la variaci ón espacial de la PSF. Las posibles deformaciones de las PSF pueden en principio tenerse en cuenta agregando variaci ón espacial en los coeficientes ki. Sin embargo esto a ñade una complejidad compu-

tacional demasiado alta, y Alard (2000) soluciona este problema, al realizar la construcci ón de la matriz de cuadrados m´ınimos partiendo la imagen en rect ángulos, donde se asume PSF constante. Esta metodolog´ıa es mucho m ás adecuada para tratar este problema, y el autor demuestra que a ñade solo un incremento en el tiempo de c álculo de alrededor 25 %.

Esta metodolog´ıa est ´a implementada en los c ´odigos de acceso libre llamados Hotpants

(Becker 2015) y ISIS (del autor de la t´ecnica).

Expansi ´on de Bramich

Bramich (2008) estableci ó una modificaci ón que subsanaba varios inconvenientes del método original de Alard, ya que trata cada p´ıxel de la PSF como un par ámetro independiente. De esta forma, la PSF es expresada como una expansi ón en funciones base de tipo

delta (Eq. 2.20) donde cada una de ellas est ´a modulada por un coeficiente que representa el valor del p´ıxel ubicado en la posici ´onui, vi.

Ker(u, v) =X

kiδ(u−ui, v−vi) (2.20)

En este caso la imagenN se expresa entonces como

Nij = X

l,m

KlmRi+l,j+m+B0 (2.21)

lo cual muestra que el p´ıxel ij es modelado como una sumatoria de los p´ıxeles de la imagen

2.3. Un candidato paraΓ: An ´alisis de diferencias de im ´agenes

t´ermino B0 es un fondo constante, el cual se ajusta simult ´aneamente con el modelo de K.

Adem ás, una ventaja del modelo es un incremento en la flexibilidad del modelado de PSF, y algo novedoso es que es capaz de corregir peque ños errores astrométricos (menores al lado del kernel K) de alineamiento entre las im ágenes. El valor F = PlmKlm es referido por el

autor como un factor de escala fotom´etrico, y surge autom ´aticamente del proceso de m´ınimos cuadrados.

Este método al no tener ninguna restricci ón sobre la forma del kernel K, posee m ás par ámetros libres que aumentan como el cuadrado del tama ño deK, lo cual se traduce en un costo computacional mucho mayor.

La determinaci ón de los coeficienteski se realiza al minimizar la funci ónQde la ecuaci ón

2.12, con la correspondiente modificaci ´on:

Q=X ij [Nij−(R∗Ker)ij] 2 /σ2ij (2.22) =X ij  Nij− X l,m KlmRi+l,j+m   2 /σ2_ij (2.23)

Esta técnica se aplica en numerosas b úsquedas de objetos variables como estrellas y tr ánsitos de exoplanetas Oelkers et al. (2015); Oelkers et al. (2013) por nombrar algunos.

2.3.2. Formalismo de Zackay

Existe un enfoque alternativo a los anteriores, propuesto recientemente por Zackay et al. (2016). Tal como los anteriormente introducidos, éste método utiliza modelos estad´ısticos para las im ágenes a tratar, pero la intenci ón de la metodolog´ıa con estos modelos es de utilizarlos para una prueba por hip ótesis.

En este marco el modelo elegido para la imagen Res

R(x, y) =zRT∗PR+R (2.24)

donde T es una imagen perfecta, tomada con un telescopio de di ámetro infinito, y sin alte- raciones de origen atmosférico;zR es la transparencia, y engloba la absorci ón instrumental y

atmosf´erica y juega un papel de punto cero fotom´etrico;PR es la PSF, la cual debe estar nor-

malizada al valor unitario; yRes el ruido propio del fondo del cielo, con varianzaV(R) =σ2R,

la cual se asume que tiene una distribuci ´on normal, y que posee correlaci ´on nula (esto es la covarianza Cov([xi], [xj]) = 0 entre pares de p´ıxeles es cero para todos los pares de p´ıxeles

posibles).

Este modelo es adecuado para realizar pruebas por hip ´otesis sobre la existencia de una nueva fuente, y las hip ´otesis nula y alternativas pueden formularse tal como:

H0:N =zN T∗PN +N (2.25)

La falta de evidencia suficiente para rechazar la hip ótesis nula (Eq.2.25) supone que ambas im ágenes registraron la misma cantidad de luz de cada fuente y no hay variabilidad detectada. En el caso contrario, la prueba otorgar´ıa confidencia sobre la existencia de una fuente puntual en la posici ónq con un flujo αen la imagen nueva N, la cual se ve afectada por la PSF PN,

transparenciazN y ruido de fondoN. En este casoδq es una imagen del mismo tama ˜no que

N, con valor nulo en todos los p´ıxeles, salvo en la posici ´onq.

Ninguna de las hip ótesis tiene par ámetros desconocidos, por lo que se puede establecer que son hip ótesissimples. En este caso es posible utilizar el lema de Neyman-Pearson (Neyman & Pearson 1933a), que establece que el estad´ıstico m ás poderoso∗ _{es la}_{tasa de verosimilitudes} (del ingléslikelihood ratio):

L(α, q) = P(N, R|H0)

P(N, R_|H1(α, q))

, (2.27)

dondeP(A_|B)es la probabilidad de queA haya sido observado dadoB. Para calcular ambas probabilidades es necesario tener informaci ´on previa del valor deT, la cual no poseemos, pero se puede ver que no es necesario para determinar el cociente. Utilizamos el teorema de Bayes, el cual establece que

P(A_|B) =P(B|A)P(A)

P(B) (2.28)

y la regla de probabilidad conjunta P(A, C_|B) =P(A_|B, C)P(C_|B), entonces podemos escribir la Eq. 2.27 como

L(α, q) = P(N|R,H0)P(R|H0)

P(N_|R,_H1(α, q))P(R|H1(α, q))

. (2.29)

Viendo que en el caso que las hip ótesis nula o alternativa sean verdaderas, s ólo implican que el modelo de N cambiar á, no que R ser á diferente. Otra forma de decirlo, es que R

es independiente del resultado de la prueba, entonces se puede simplemente cancelar los t´erminos de la derecha en el numerador y denominador:

L(α, q) = P(N|R,H0)

P(N_|R,_H1(α, q))

. (2.30)

Para poder realizar los c ´alculos de _P(N_|R,_H0) es necesario trabajar en el espacio de fre-

cuencias espaciales mediante las transformadas de Fourier. Un detalle que es importante aqu´ı, es que este método asume que las fuentes de ruido observacional de las im ágenes pro- viene principalmente del fondo de cielo. Esto es una restricci ón importante, aunque la condi- ci ón se cumple para la mayor´ıa de las im ágenes astron ómicas. De esta forma las propiedades del ruido de las im ágenesNb yRbse pueden determinar, para cualquiera de las dos hip ótesis:

b R|H0 =Rb|H1 =zR TbPcR+cR (2.31) b N_|H₀ =zN TbPcN +cN (2.32) b N|H1 =zN (Tb+αδbq)PcN+cN (2.33) dondeb es ruido blanco Gaussiano, para ambas im ágenes. Dado que R es independiente de las hip ótesis, y que adem ás es observada, podemos entonces conseguir una expresi ón paraTb

2.3. Un candidato paraΓ: An ´alisis de diferencias de im ´agenes (dado quePcR6= 0): b T = Rb zRPcR − cR zRPcR , (2.34)

la cual nos es ´util para poder sustituirla en la expresi ´on deNb:

b N_| b R= b R zRPcR zNPcN− c R zRPcR zNPcN +cN (2.35) b N_|H₁= Rb zRPcR zNPcN− c R zRPcR zNPcN +αδbqzNPcN +cN. (2.36)

Para finalmente estimar las probabilidades utilizaremos el estimadorχ2_{, de forma tal que}

log(_P[Nb_|R,b _H0]) =χ2(N ,b Nb_|bR,H0) (2.37) log(P[Nb_|R,b _H1]) =χ2(N ,b Nb_|b_R,_H₁) (2.38)

donde nos anticipamos al calcular los logaritmos de las probabilidades, ya que maximizar el valor delogLes igual a maximizarL, por lo que podemos escribir

log(L(q, α)) =χ2(N, N_|R,H0)−χ

(N, N_|R,H1). (2.39)

Como resultado final, el autor entonces aplica una separaci ón de la maximizaci ón de este valor en ambos par ámetros q y α. Nuevamente recordemos que q es la posici ón y α es el flujo de la nueva fuente, que estamos tratando de identificar mediante la prueba de hip ótesis. Debido a que estos dos par ámetros ya no posibilitan la aplicaci ón del lema de Neyman-Pearson, entonces se deben desviar por un instante, encontrando un escalar auxiliar que les permita aplicar el teorema de Karlin & Rubin (1956), y as´ı encontrar la expresi ón final paralog[_L(q, α)]. Finalmente, se demuestra que maximizar la ecuaci ón 2.27 es equivalente a maximizar el estad´ısticoS de la ecuaci ón Eq. 2.40

S:= log[L(α, q)]

α (2.40)

y luego de c álculos intermedios la expresi ón para la transformada de Fourier deS se obtiene en términos de las transformadas de Fourier de cantidades ya conocidas.

b S= zN z 2 RPcN |PcR|2Nb−zR z2N PcR |PcN|2 Rb σ2 Rz 2 N|PcN|2+σ 2 Nz 2 R|PcR|2 . (2.41)

Analizando en detalle el resultado observamos principalmente que S es un estimador con la misma forma que una imagen astron ´omica. Sin embargo no estamos listos para decir que

S esla imagen diferencia, ya que esta es un estimador de la probabilidad de que exista una nueva fuente. Esto es, en cada p´ıxelq deS nos encontramos con un valor que representa la evidencia colectada a favor de la existencia de una fuente nueva. Como α es el valor de la intensidad de la supuesta nueva fuente, vemos queS est á normalizada, de forma tal quesolo es necesario determinar los máximos y m´ınimos locales deSpara obtener las posiciones de los candidatos a transitorios. La significancia de la prueba por hip ótesis esta dada por el valor deS en la ubicaci ón de este extremo, sobre la desviaci ón est ándar deS.

Este método posee una interpretaci ón interesante a la f órmula de la Eq. 2.41, ya que posee las propiedades de una imagen procesada por lo que se conoce como unmatched filter. El filtro lineal utilizado en este caso puede identificarse como la PSF PcD de la real imagen diferencia

b D: b D=qzRPcRNb−zN PcN Rb σ2 Nz 2 R|PcR|2+σR2z 2 N|PcN|2

In document Interteaching: Types of prep guide questions and their effect on student quiz performance (Page 50-59)