Pipelines y fotometría en ALHAMBRA.
En Astronomía, el trabajo con las observaciones no se acaba al terminar la noche y cerrar el telescopio. Aún queda una importante etapa de la que depende críticamente la calidad de los datos que vamos a obtener y de la Ciencia resultante: La reducción y procesado de datos. Debemos corregir los efectos instrumentales, calibrar y caracterizar la calidad de nuestras observaciones.
En el caso de ALHAMBRA, nos encontramos con una gran cantidad de imágenes dado que cubre varios grados cuadrados en el cielo, mapeados con cámaras CCD de minutos de campo, en 23 bandas fotométricas (20 en la zona óptica y tres en el cercano infrarrojo) de las que queremos extraer toda la información fotométrica posible para todos los objetos que sean detectables en ellas. En este proyecto hemos utilizado además la técnica de “dithering” para obtener las imágenes (en cada zona a estudiar y banda fotométrica, se hacen exposiciones relativamente cortas entre las que se realiza un pequeño movimiento del campo de visión) esto nos da como ventaja el observar el mismo objeto sobre diferentes zonas del detector minimizando así los errores de variaciones de sensibilidad de éste y eliminando las detecciones espúreas que sólo aparecen en una de las subimágenes. En infrarrojo, dado el alto nivel de fondo de cielo, esta técnica es obligatoria, mientras que en las bandas ópticas nos permitía combinar observaciones incluso en diferentes campañas en telescopio hasta obtener el tiempo de integración requerido.
Dado el gran volumen de datos con que contábamos, se hacia del todo imposible realizar el trabajo de manera interactiva; por tanto era necesario diseñar software que hiciera el trabajo de la reducción de manera automática; a este tipo de sistemas los solemos denominar pipelines. El trabajo realizado, a grandes rasgos, para ALHAMBRA ha consistido en:
a) Diseño del sistema informático. Debía ser tolerante a fallos y redundante, lo que nos obligó a utilizar sistemas de ficheros de acceso múltiple (dos o más ordenadores pueden acceder simultáneamente y no se deben producir inconsistencias). Utilizamos finalmente un sistema con varios ordenadores linux accediendo por fibra óptica a tres sistemas de discos formateados como OCFS2.
b) Sistema de procesado de las imágenes. Dadas las características de LAICA (el instrumento utilizado para las observaciones en los 20 filtros ópticos) con 4 CCDs con diferente respuesta y en cada CCD con 4 amplificadores distintos de lectura, no se podían utilizar los métodos estándar de reducción de datos. Por ello se desarrolló un sistema específico para la obtención de los flat-fields (variaciones de la respuesta pixel a pixel del chip CCD) y corrección de esta respuesta; para la eliminación de corriente de oscuridad (pequeña corriente eléctrica que existe incluso cuando no hay luz) y bias (nivel cero de codificación). También se escribió software para la corrección de efectos que aparecían sistemáticamente, como trazas de aviones o satélites (una linea brillante en las imágenes) o la detección de la araña del espejo secundario en las observaciones NIR. Tras este procesado se realizó la calibración astrométrica, asignando coordenadas en el cielo a cada pixel CCD. Las imágenes infrarrojas, observadas con un instrumento diferente (Omega2000), se escalaron al tamaño de píxel de las ópticas; así conseguimos un conjunto de imágenes perfectamente alineadas donde cada posición de píxel es la misma en los 23 filtros.
c) Combinación de subimágenes, teniendo en cuenta mapas de peso y máscaras de zonas no útiles, por ejemplo por la presencia de estrellas saturadas. También se incluyeron en la “pipeline” algoritmos de eliminación de objetos “fantasma” (imágenes secundarias de fuentes muy brillantes). Tras todo este procedimiento se incluyó en la pipeline la calibración fotométrica esto es la transformación del conteo que medimos en unidades físicas.
d) Detección e identificación de todos los objetos que existen en cada imagen y en cada filtro. Se trata de medir el flujo integrado que cada uno de estos objetos exhibe por filtro y así obtener la distribución espectral de energía, en el dominio óptico-infrarrojo cercano, de cada uno de ellos. En añadidura, se obtienen parámetros de forma de los objetos puntuales (fundamentalmente estrellas) que nos permitirán caracterizar parte de la calidad de cada observación.
Imagen compuesta (detalle) de detección
Para maximizar el número de objetos y realizar una buena separación entre ellos, es necesario contar con imágenes muy profundas y de muy buen seeing. El método eficiente que seguimos en ALHAMBRA fue combinar las imágenes con mayor señal a ruido y de mejor seeing. Aunque no impusimos ninguna restricción más, el resultado final siempre consiste en imágenes de detección con una respuesta similar a la del filtro i del SDSS. Esto se debe a que el seeing disminuye con la longitud de onda y es en esa zona del espectro donde además tiene su máximo la respuesta de los detectores CCD. Esta técnica es mejor que la de tomar imágenes en banda ancha ex profeso para detección, y así mejora la eficiencia en telescopio. En esta imagen (deep en nuestra jerga) se realiza la identificación de los objetos, así como de los parámetros de integración. A continuación se realiza la fotometría en las imágenes en cada banda fotométrica utilizando las posiciones y aperturas fijadas por la imagen deep.
e) Almacenamiento de imágenes resultantes y creación de una base de datos con la fotometría de todos los objetos. Esta base de datos se diseñó para que fuera accesible mediante consulta pública web; por lo que fue necesario también el diseño de la propia página web de ALHAMBRA, donde se incluyeran además de la información fotométrica de los objetos, las calibraciones,...y el acceso a las imágenes resultantes.
f) Caracterización de las observaciones y calidad de los datos obtenidos. La medida de la calidad de nuestros datos nos la ha proporcionado, para cada imagen CCD, el análisis de la anchura y elipticidad de las imágenes estelares (medida de la psf), la magnitud límite a la que somos capaces de detectar todos los objetos (se realiza inyectando aleatoriamente fuentes de distinta magnitud y analizando cuantas se recuperan por intervalo de magnitud) y el análisis de la distribución de errores y relación señal/ruido a distintos flujos totales.
Las pipelines desarrolladas son básicamente grandes programas escritos en el lenguaje orientado a objetos python, con extensiones para cálculo tales como numpy, scipy o pyfits junto a algunas más escritas por nosotros en C/Fortran y desde donde se hacen llamadas a programas contenidos en los sistemas de software IRAF, Daophot o Astromatic: SWarp, SCAMP y una de las joyas de la corona del software astronómico: SExtractor. El almacenamiento y gestión de bases de datos ha realizado en mysql controlado por python.
Una vez que se obtuvieron las magnitudes de todos los objetos, se realizó la corrección de extinción interestelar. El ajuste fino de la fotometría se realizó utilizando las estrellas de todos los campos, mediante el ajuste de su distribución espectral de energía observada (desde 330 a 2000nm) a patrones contenidos en bibliotecas de espectros estelares. Este procedimiento detectó pequeños offsets, fundamentalemente en las bandas azules, que se han introducido en los catálogos.
Como último paso del proceso, se ha realizado la separación entre estrellas y galaxias, atendiendo primero a su forma (las galaxias son objetos que muestran una extensión mayor que la del ensanchamiento instrumental) y después a su distribución espectral de energía; donde técnicas como regresión logística o redes neuronales nos han permitido realizar una buena separación fotométrica.
Relación entre la magnitud i (sintetizada a partir de varios
filtros alhambra) y magnitud en imagen de detección
Finalmente queremos mencionar que todo este trabajo para el proyecto ALHAMBRA ha sido realizado por un equipo en el que han participado, además de los autores, Cesar Husillos, Ascensión del Olmo y Miguel Cerviño.
Ajustes de observaciones de estrellas (puntos) a modelos. Se muestra el tipo espectral que se estima
Jaime Perea, Instituto de Astrofísica de Andalucía
David Cristóbal, Centro de Estudios de Física del Cosmos de Aragón