Desde principios del siglo XX, los científicos y físicos han tenido la carga de explicar cómo y por qué el Universo parece expandirse a un ritmo acelerado. Además de ser responsable de la aceleración cósmica, también se cree que esta energía comprende el 68,3% de la masa no visible del universo.
Al igual que la materia oscura, la existencia de esta fuerza invisible se basa en fenómenos observables y porque coincide con nuestros modelos actuales de cosmología, y no con evidencia directa. En cambio, los científicos deben confiar en observaciones indirectas, observando cómo los objetos cósmicos rápidos (específicamente las supernovas Tipo Ia) retroceden de nosotros a medida que el universo se expande.
Este proceso sería extremadamente tedioso para los científicos, como los que trabajan para el Dark Energy Survey (DES), si no fuera por los nuevos algoritmos desarrollados en colaboración por investigadores del Laboratorio Nacional Lawrence Berkeley y UC Berkeley.
"Nuestro algoritmo puede clasificar la detección de un candidato a supernova en aproximadamente 0.01 segundos, mientras que un escáner humano experimentado puede tomar varios segundos", dijo Danny Goldstein, un estudiante graduado de UC Berkeley que desarrolló el código para automatizar el proceso de descubrimiento de supernova en imágenes DES .
Actualmente en su segunda temporada, el DES toma fotografías nocturnas del cielo del sur con DECam, una cámara de 570 megapíxeles montada en el telescopio Victor M. Blanco en el Observatorio Interamericano Cerro Tololo (CTIO) en los Andes chilenos. Todas las noches, la cámara genera entre 100 Gigabytes (GB) y 1 Terabyte (TB) de datos de imágenes, que se envían al Centro Nacional de Aplicaciones de Supercomputación (NCSA) y al Fermilab del DOE en Illinois para el procesamiento y archivo inicial.
Los programas de reconocimiento de objetos desarrollados en el Centro Nacional de Computación Científica de Investigación Energética (NERSC) e implementados en NCSA luego peinan las imágenes en busca de posibles detecciones de supernovas de Tipo Ia. Estas poderosas explosiones ocurren en sistemas estelares binarios donde una estrella es una enana blanca, que acumula material de una estrella compañera hasta que alcanza una masa crítica y explota en una supernova Tipo Ia.
"Estas explosiones son notables porque se pueden utilizar como indicadores de distancia cósmica con una precisión del 3-10 por ciento", dice Goldstein.
La distancia es importante porque cuanto más lejos se encuentra un objeto en el espacio, más atrás está en el tiempo. Al rastrear las supernovas Tipo Ia a diferentes distancias, los investigadores pueden medir la expansión cósmica a lo largo de la historia del universo. Esto les permite imponer restricciones sobre qué tan rápido se está expandiendo el universo y tal vez incluso proporcionar otras pistas sobre la naturaleza de la energía oscura.
"Científicamente, es un momento realmente emocionante porque varios grupos de todo el mundo están tratando de medir con precisión las supernovas de tipo Ia para restringir y comprender la energía oscura que impulsa la expansión acelerada del universo", dice Goldstein, quien también es estudiante. investigador en el Centro de Cosmología Computacional de Berkeley Lab (C3).
El DES comienza su búsqueda de explosiones de Tipo Ia descubriendo cambios en el cielo nocturno, que es donde entra en juego la tubería de sustracción de imágenes desarrollada e implementada por investigadores del grupo de trabajo de supernovas del DES. La tubería sustrae imágenes que contienen objetos cósmicos conocidos de nuevas imágenes. que están expuestos todas las noches en CTIO.
Cada noche, la tubería produce entre 10,000 y unos pocos cientos de miles de detecciones de candidatos a supernovas que deben validarse.
“Históricamente, los astrónomos entrenados se sentaban frente a la computadora durante horas, observaban estos puntos y ofrecían opiniones sobre si tenían las características de una supernova o si eran causados por efectos espurios que se disfrazaban de supernovas en los datos. Este proceso parece sencillo hasta que te das cuenta de que la cantidad de candidatos que deben clasificarse cada noche es prohibitivamente grande y solo uno de cada cientos es una supernova real de cualquier tipo ”, dice Goldstein. “Este proceso es extremadamente tedioso y requiere mucho tiempo. También ejerce mucha presión sobre el grupo de trabajo de supernovas para que procese y escanee datos rápidamente, lo cual es un trabajo duro ”.
Para simplificar la tarea de examinar a los candidatos, Goldstein desarrolló un código que utiliza la técnica de aprendizaje automático "Random Forest" para examinar las detecciones de candidatos a supernova de forma automática y en tiempo real para optimizarlos para el DES. La técnica emplea un conjunto de árboles de decisión para hacer automáticamente los tipos de preguntas que los astrónomos normalmente considerarían al clasificar a los candidatos a supernovas.
Al final del proceso, cada detección de un candidato recibe una puntuación basada en la fracción de árboles de decisión que considera que tiene las características de una detección de una supernova. Cuanto más cercano sea el puntaje de clasificación a uno, más fuerte será el candidato. Goldstein señala que en las pruebas preliminares, el proceso de clasificación alcanzó una precisión general del 96 por ciento.
"Cuando haces la resta solo, obtienes demasiados" falsos positivos ", artefactos instrumentales o de software que se muestran como posibles candidatos a supernovas, para que los humanos puedan examinarlos", dice Rollin Thomas, del C3 de Berkeley Lab, quien fue colaborador de Goldstein.
Señala que con el clasificador, los investigadores pueden filtrar de forma rápida y precisa los artefactos de los candidatos a supernova. "Esto significa que, en lugar de tener 20 científicos del grupo de trabajo de supernovas que examinan continuamente a miles de candidatos todas las noches, puedes nombrar a una persona para que mire a unos pocos cientos de candidatos fuertes", dice Thomas. "Esto acelera significativamente nuestro flujo de trabajo y nos permite identificar supernovas en tiempo real, lo cual es crucial para realizar observaciones de seguimiento".
"Usando aproximadamente 60 núcleos en una supercomputadora podemos clasificar 200,000 detecciones en aproximadamente 20 minutos, incluido el tiempo para la interacción de la base de datos y la extracción de características". dice Goldstein.
Goldstein y Thomas señalan que el siguiente paso en este trabajo es agregar un segundo nivel de aprendizaje automático a la tubería para mejorar la precisión de la clasificación. Esta capa adicional tendría en cuenta cómo se clasificó el objeto en observaciones anteriores, ya que determina la probabilidad de que el candidato sea "real". Los investigadores y sus colegas están trabajando actualmente en diferentes enfoques para lograr esta capacidad.