El an ´alisis de diferencia de im ´agenes es una t´ecnica que compara directamente dos im ´age- nes de la misma porci ´on del cielo en distintos momentos. Es usual que una de ellas sea una
co-adici ´onde varias im ´agenes tomadas previamente, y que posea una alta relaci ´on se ˜nal/ruido conocida comoimagen de referencia (R). La otra im ´agen ser´ıa la recientemente adquiridanue- va imagen (N). Ambas im ´agenes se asumen astrom´etricamente alineadas, y de esta forma se realiza una resta para obtener candidatos a eventos de variabilidad transitoria. Esta sustrac- ci ´on de im ´agenes no debe ser tomada a la ligera, ya que es necesario resolver una transfor- maci ´on de las propiedades fotom´etricas de R y N, para as´ı poder realizar una comparaci ´on adecuada.
Las diferencias involucradas pueden llegar a ser de diversa ´ındole, y entre las m ´as impor- tantes se destacan la variaci ´on de la PSF, la variaci ´on del fondo del cielo, diferentes respuestas instrumentales, o diferentes relaciones de se ˜nal/ruido. A veces tambi´en pueden estar invo- lucradas distorsiones locales de las im ´agenes, como ser las provenientes de la curvatura de campo, o aberraciones crom ´aticas, de coma, o incluso casos de instrumento fuera de foco, entre otras.
2.3.1. Modelos con kernel linealizado
La resta de im ´agenes se remonta a Phillips & Davis (1995) donde se plantea la ecuaci ´on 2.9, que conecta la imagen nueva y la referencia en una dada posici ´on (x, y). Esta conexi ´on es por medios de una deconvoluci ´on con unkernel (Ker(u, v)), ligado directamente al cambio de forma de la PSF entre ambas im ´agenes. Una soluci ´on directa de esto mismo podr´ıa llegar a ser la ecuaci ´on 2.10, la cual despeja el valor del kernel en el espacio de Fourier.
R(x, y)∗Ker(u, v) =N(x, y) (2.9)
d
Ker= Nb
b
R (2.10)
Sin embargo este tipo de estrategia sufre de inestabilidad num´erica. Es muy frecuente que ocurra una divisi ´on por n ´umeros peque ˜nos, causado por el denominador de esta ecuaci ´on, el cual puede aproximarse a cero m ´as r ´apido que el numerador. Un ejemplo de un caso donde esto ocurre, es cuando la PSF de la imagen N es fortuitamente m ´as estrecha que la PSF de
R. Adem ´as en casos donde no exista una virtual divisi ´on por cero es posible que la operaci ´on amplifique los ruidos propios de las im ´agenes causando distorsiones de baja frecuencia, y tambi´en anillos de alta frecuencia.
Una soluci ´on directa del kernel de deconvoluci ´on, como la planteada, puede llegar a ser innecesaria. En cambio, plantear una expansi ´on deKeren funciones base es posible, utilizan- do como suposici ´on fuerte que en una dada serie de im ´agenes a sustraer la forma funcional de Ker ser ´a estable, y bien modelable por funciones anal´ıticas. Esta estrategia se denomina
2.3. Un candidato paraΓ: An ´alisis de diferencias de im ´agenes
Modelo de Alard-Lupton
El modelo de kernel linealizado se desarrollo en detalle por Alard & Lupton (1998), donde se plantea una descomposici ´on en funciones base Bi(x, y): Ker =PikiBi(x, y), donde ki son
los coeficientes. Esto, al incluirlo en la ecuaci ´on 2.9 tendremos (R∗Ker)(x, y) =X i kiR(x, y)∗Bi(x, y)≡ X i kiCi(x, y) (2.11)
. Para hallar los coeficientes correctos se aplica la metodolog´ıa de cuadrados m´ınimos, defi- niendo una funci ´on costoQ:
Q= Z [N−(R∗Ker)]2/σ2dxdy (2.12) = Z " N−X i kiCi #2 /σ2dxdy (2.13)
dondeσ(x, y)2es la varianza del valor de los p´ıxeles. En este caso, se aproxima la distribuci ´on
de los valores de los p´ıxeles como distribuciones Gaussianas, en lugar de distribuciones Pois- son (tal como el proceso del conteo discreto de las cuentas de los p´ıxeles sugiere), teniendo entonces σ(x, y) ∝ pN(x, y). Aplicando la ecuaci ´on b ´asica de minimizaci ´on de funciones, e igualando a cero tendremos:
∂Q ∂ki = 2 Z N−X j kjCj Ci/σ2dxdy= 0 (2.14)
Esto es igual a tener la siguiente relaci ´on:
X j kj Z Ci Cj/σ2dx dy= Z N Ci/σ2dxdy (2.15)
la cual puede expresarse como una ecuaci ´on matricial
X j Mijkj=bi (2.16) Mij = Z Ci(x, y)Cj(x, y)/σ2 dxdy (2.17) bi= Z N(x, y)Ci(x, y)/σ2 dxdy. (2.18)
Este modelo de kernel linealizado es extremadamente ´util, ya que invirtiendo el sistema de ecuaciones de la Eq. 2.16 podemos obtener una serie de coeficientes que describan a la transformaci ´on para escribirNen t´erminos deR. El elemento faltante aqu´ı es la especificaci ´on de las funciones base a utilizar.
La primer descomposici ´on propuesta fue una suma de funciones Gaussianas, moduladas por un polinomio de orden bajo (u(x), v(y)), como la Eq. 2.19. Estos polinomios representan suaves modificaciones de la PSF a lo largo del campo de la imagen, variando la importancia de cada funci ´on base de manera local.
Bi(x, y) =e−(x
2+y2)/2σ
i u
Este modelo es adecuado en el caso de una PSF dominada por turbulencia atmosf´erica, ya que todas las componentes ser ´an funciones Gaussianas, de distinta extensi ´on. Es adem ´as de lidiar con distorsiones de campo de menor orden, por ejemplo curvatura de campo en el borde de la imagen, sin perder precisi ´on significativamente.
Sin embargo este modelo no es lo suficientemente vers ´atil en todos los casos, y no es capaz de representar PSFs con estructuras complejas. Por ejemplo en el caso de PSFs que no llegan a estar bien muestreadas espacialmente, ya sea por una escala de placa demasiado grande, o por un FWHM excepcionalmente estrecho. Otro caso donde es posible encontrar errores de modelado de la PSF es el caso de una imagen ligeramente fuera de foco, ensanchando el centro del perfil de PSF, dif´ıcil de reproducir con Gaussianas. En cualquiera de los casos anteriores las substracciones de im ´agenes con este tipo de metodolog´ıa puede presentar artefactos.
Adem ´as de lo mencionado, el m´etodo provee una forma de ajustar la diferencia de fondo de cielo, pero no es un elemento cr´ıtico del m´etodo, ya que esto puede ser sustra´ıdo de ma- nera independiente, durante el pre-procesado de las im ´agenes a tratar. Esta metodolog´ıa sin embargo, no es capaz de determinar el n ´umero de funciones base a utilizar, ni tampoco su tama ˜no. Ambos par ´ametros deben ser obtenidos de forma emp´ırica previamente.
Un detalle del m´etodo, que no hemos tenido en cuenta es la variaci ´on espacial de la PSF. Las posibles deformaciones de las PSF pueden en principio tenerse en cuenta agregando variaci ´on espacial en los coeficientes ki. Sin embargo esto a ˜nade una complejidad compu-
tacional demasiado alta, y Alard (2000) soluciona este problema, al realizar la construcci ´on de la matriz de cuadrados m´ınimos partiendo la imagen en rect ´angulos, donde se asume PSF constante. Esta metodolog´ıa es mucho m ´as adecuada para tratar este problema, y el autor demuestra que a ˜nade solo un incremento en el tiempo de c ´alculo de alrededor 25 %.
Esta metodolog´ıa est ´a implementada en los c ´odigos de acceso libre llamados Hotpants
(Becker 2015) y ISIS (del autor de la t´ecnica).
Expansi ´on de Bramich
Bramich (2008) estableci ´o una modificaci ´on que subsanaba varios inconvenientes del m´etodo original de Alard, ya que trata cada p´ıxel de la PSF como un par ´ametro indepen- diente. De esta forma, la PSF es expresada como una expansi ´on en funciones base de tipo
delta (Eq. 2.20) donde cada una de ellas est ´a modulada por un coeficiente que representa el valor del p´ıxel ubicado en la posici ´onui, vi.
Ker(u, v) =X
i
kiδ(u−ui, v−vi) (2.20)
En este caso la imagenN se expresa entonces como
Nij = X
l,m
KlmRi+l,j+m+B0 (2.21)
lo cual muestra que el p´ıxel ij es modelado como una sumatoria de los p´ıxeles de la imagen
2.3. Un candidato paraΓ: An ´alisis de diferencias de im ´agenes
t´ermino B0 es un fondo constante, el cual se ajusta simult ´aneamente con el modelo de K.
Adem ´as, una ventaja del modelo es un incremento en la flexibilidad del modelado de PSF, y algo novedoso es que es capaz de corregir peque ˜nos errores astrom´etricos (menores al lado del kernel K) de alineamiento entre las im ´agenes. El valor F = PlmKlm es referido por el
autor como un factor de escala fotom´etrico, y surge autom ´aticamente del proceso de m´ınimos cuadrados.
Este m´etodo al no tener ninguna restricci ´on sobre la forma del kernel K, posee m ´as par ´ametros libres que aumentan como el cuadrado del tama ˜no deK, lo cual se traduce en un costo computacional mucho mayor.
La determinaci ´on de los coeficienteski se realiza al minimizar la funci ´onQde la ecuaci ´on
2.12, con la correspondiente modificaci ´on:
Q=X ij [Nij−(R∗Ker)ij] 2 /σ2ij (2.22) =X ij Nij− X l,m KlmRi+l,j+m 2 /σ2ij (2.23)
Esta t´ecnica se aplica en numerosas b ´usquedas de objetos variables como estrellas y tr ´ansitos de exoplanetas Oelkers et al. (2015); Oelkers et al. (2013) por nombrar algunos.
2.3.2. Formalismo de Zackay
Existe un enfoque alternativo a los anteriores, propuesto recientemente por Zackay et al. (2016). Tal como los anteriormente introducidos, ´este m´etodo utiliza modelos estad´ısticos para las im ´agenes a tratar, pero la intenci ´on de la metodolog´ıa con estos modelos es de utilizarlos para una prueba por hip ´otesis.
En este marco el modelo elegido para la imagen Res
R(x, y) =zRT∗PR+R (2.24)
donde T es una imagen perfecta, tomada con un telescopio de di ´ametro infinito, y sin alte- raciones de origen atmosf´erico;zR es la transparencia, y engloba la absorci ´on instrumental y
atmosf´erica y juega un papel de punto cero fotom´etrico;PR es la PSF, la cual debe estar nor-
malizada al valor unitario; yRes el ruido propio del fondo del cielo, con varianzaV(R) =σ2R,
la cual se asume que tiene una distribuci ´on normal, y que posee correlaci ´on nula (esto es la covarianza Cov([xi], [xj]) = 0 entre pares de p´ıxeles es cero para todos los pares de p´ıxeles
posibles).
Este modelo es adecuado para realizar pruebas por hip ´otesis sobre la existencia de una nueva fuente, y las hip ´otesis nula y alternativas pueden formularse tal como:
H0:N =zN T∗PN +N (2.25)
La falta de evidencia suficiente para rechazar la hip ´otesis nula (Eq.2.25) supone que ambas im ´agenes registraron la misma cantidad de luz de cada fuente y no hay variabilidad detectada. En el caso contrario, la prueba otorgar´ıa confidencia sobre la existencia de una fuente puntual en la posici ´onq con un flujo αen la imagen nueva N, la cual se ve afectada por la PSF PN,
transparenciazN y ruido de fondoN. En este casoδq es una imagen del mismo tama ˜no que
N, con valor nulo en todos los p´ıxeles, salvo en la posici ´onq.
Ninguna de las hip ´otesis tiene par ´ametros desconocidos, por lo que se puede establecer que son hip ´otesissimples. En este caso es posible utilizar el lema de Neyman-Pearson (Neyman & Pearson 1933a), que establece que el estad´ıstico m ´as poderoso∗ es latasa de verosimilitudes (del ingl´eslikelihood ratio):
L(α, q) = P(N, R|H0)
P(N, R|H1(α, q))
, (2.27)
dondeP(A|B)es la probabilidad de queA haya sido observado dadoB. Para calcular ambas probabilidades es necesario tener informaci ´on previa del valor deT, la cual no poseemos, pero se puede ver que no es necesario para determinar el cociente. Utilizamos el teorema de Bayes, el cual establece que
P(A|B) =P(B|A)P(A)
P(B) (2.28)
y la regla de probabilidad conjunta P(A, C|B) =P(A|B, C)P(C|B), entonces podemos escribir la Eq. 2.27 como
L(α, q) = P(N|R,H0)P(R|H0)
P(N|R,H1(α, q))P(R|H1(α, q))
. (2.29)
Viendo que en el caso que las hip ´otesis nula o alternativa sean verdaderas, s ´olo implican que el modelo de N cambiar ´a, no que R ser ´a diferente. Otra forma de decirlo, es que R
es independiente del resultado de la prueba, entonces se puede simplemente cancelar los t´erminos de la derecha en el numerador y denominador:
L(α, q) = P(N|R,H0)
P(N|R,H1(α, q))
. (2.30)
Para poder realizar los c ´alculos de P(N|R,H0) es necesario trabajar en el espacio de fre-
cuencias espaciales mediante las transformadas de Fourier. Un detalle que es importante aqu´ı, es que este m´etodo asume que las fuentes de ruido observacional de las im ´agenes pro- viene principalmente del fondo de cielo. Esto es una restricci ´on importante, aunque la condi- ci ´on se cumple para la mayor´ıa de las im ´agenes astron ´omicas. De esta forma las propiedades del ruido de las im ´agenesNb yRbse pueden determinar, para cualquiera de las dos hip ´otesis:
b R|H0 =Rb|H1 =zR TbPcR+cR (2.31) b N|H0 =zN TbPcN +cN (2.32) b N|H1 =zN (Tb+αδbq)PcN+cN (2.33) dondeb es ruido blanco Gaussiano, para ambas im ´agenes. Dado que R es independiente de las hip ´otesis, y que adem ´as es observada, podemos entonces conseguir una expresi ´on paraTb
2.3. Un candidato paraΓ: An ´alisis de diferencias de im ´agenes (dado quePcR6= 0): b T = Rb zRPcR − cR zRPcR , (2.34)
la cual nos es ´util para poder sustituirla en la expresi ´on deNb:
b N| b R= b R zRPcR zNPcN− c R zRPcR zNPcN +cN (2.35) b N|H1= Rb zRPcR zNPcN− c R zRPcR zNPcN +αδbqzNPcN +cN. (2.36)
Para finalmente estimar las probabilidades utilizaremos el estimadorχ2, de forma tal que
log(P[Nb|R,b H0]) =χ2(N ,b Nb|bR,H0) (2.37) log(P[Nb|R,b H1]) =χ2(N ,b Nb|bR,H1) (2.38)
donde nos anticipamos al calcular los logaritmos de las probabilidades, ya que maximizar el valor delogLes igual a maximizarL, por lo que podemos escribir
log(L(q, α)) =χ2(N, N|R,H0)−χ
2
(N, N|R,H1). (2.39)
Como resultado final, el autor entonces aplica una separaci ´on de la maximizaci ´on de este valor en ambos par ´ametros q y α. Nuevamente recordemos que q es la posici ´on y α es el flujo de la nueva fuente, que estamos tratando de identificar mediante la prueba de hip ´otesis. Debido a que estos dos par ´ametros ya no posibilitan la aplicaci ´on del lema de Neyman-Pearson, entonces se deben desviar por un instante, encontrando un escalar auxiliar que les permita aplicar el teorema de Karlin & Rubin (1956), y as´ı encontrar la expresi ´on final paralog[L(q, α)]. Finalmente, se demuestra que maximizar la ecuaci ´on 2.27 es equivalente a maximizar el estad´ısticoS de la ecuaci ´on Eq. 2.40
S:= log[L(α, q)]
α (2.40)
y luego de c ´alculos intermedios la expresi ´on para la transformada de Fourier deS se obtiene en t´erminos de las transformadas de Fourier de cantidades ya conocidas.
b S= zN z 2 RPcN |PcR|2Nb−zR z2N PcR |PcN|2 Rb σ2 Rz 2 N|PcN|2+σ 2 Nz 2 R|PcR|2 . (2.41)
Analizando en detalle el resultado observamos principalmente que S es un estimador con la misma forma que una imagen astron ´omica. Sin embargo no estamos listos para decir que
S esla imagen diferencia, ya que esta es un estimador de la probabilidad de que exista una nueva fuente. Esto es, en cada p´ıxelq deS nos encontramos con un valor que representa la evidencia colectada a favor de la existencia de una fuente nueva. Como α es el valor de la intensidad de la supuesta nueva fuente, vemos queS est ´a normalizada, de forma tal quesolo es necesario determinar los m´aximos y m´ınimos locales deSpara obtener las posiciones de los candidatos a transitorios. La significancia de la prueba por hip ´otesis esta dada por el valor deS en la ubicaci ´on de este extremo, sobre la desviaci ´on est ´andar deS.
Este m´etodo posee una interpretaci ´on interesante a la f ´ormula de la Eq. 2.41, ya que posee las propiedades de una imagen procesada por lo que se conoce como unmatched filter. El filtro lineal utilizado en este caso puede identificarse como la PSF PcD de la real imagen diferencia
b D: b D=qzRPcRNb−zN PcN Rb σ2 Nz 2 R|PcR|2+σR2z 2 N|PcN|2