A classificação de objetos astronómicos sempre foi um problema. A distâncias quase inimagináveis, por vezes torna-se difícil para os astrofísicos distinguir se estes objetos são estrelas, galáxias, quasares, supernovas ou nebulosas, por exemplo. Para tentar resolver este problema clássico, os investigadores Pedro Cunha e Andrew Humphrey, do Instituto de Astrofísica e Ciências do Espaço (IA), na Universidade do Porto, criaram o SHEEP, um algoritmo de inteligência artificial (machine learning) que determina a natureza dos astros.

Revelado num artigo publicado na prestigiada revista Astronomy & Astrophysics, o SHEEP nasceu como um projeto paralelo da dissertação de mestrado de Pedro Cunha. “É a combinação de tudo o que aprendi durante o tempo que passei num projeto único”, descreve o atual estudante do doutoramento em Astronomia da Faculdade de Ciências da U.Porto (FCUP), a desenvolver a sua investigação no IA.

“O problema de catalogar objetos astronómicos é muito desafiante, devido à sua quantidade e à complexidade do Universo, mas a inteligência artificial está a revelar-se uma ferramenta muito promissora para a resolução deste problema”.

“Foi espantoso obter um resultado tão interessante, em especial numa dissertação de mestrado!”, revela por sua vez Andrew Humphrey, o orientador do mestrado e agora coorientador do doutoramento de Pedro Cunha. Até porque “o problema de catalogar objetos astronómicos é muito desafiante, devido à sua quantidade e à complexidade do Universo”, realça o investigador, notando, contudo, que “a inteligência artificial está a revelar-se uma ferramenta muito promissora para a resolução deste problema”.

O Universo a três dimensões

Na prática, o SHEEP é uma pipeline de inteligência artificial supervisionada, que estima desvios para o vermelho fotométricos e que mais tarde usa esta informação para classificar objetos astronómicos como galáxias, quasares ou estrelas. “A informação fotométrica é a mais fácil de obter e por isso é muito importante numa primeira análise à natureza dos objetos observados”, explica Pedro Cunha.

Uma das novidades do processo é que o SHEEP, antes de iniciar a classificação, primeiro estima desvios para o vermelho fotométricos, informação que é adicionada aos dados, como uma característica adicional para a aprendizagem do modelo de classificação.

A equipa descobriu que, ao incluir estes dados junto com as coordenadas (ascensão reta e declinação) dos objetos, a inteligência artificial era capaz de percecionar o Universo em 3D e usar esse conhecimento, em paralelo com informação de cor, para fazer estimativas mais precisas das propriedades dos objetos. Por exemplo, o algoritmo aprendeu que há uma maior probabilidade de encontrar estrelas mais perto do plano da Via Láctea do que nos polos galácticos.

“Quando demos à inteligência artificial uma visão tridimensional do Universo, aumentámos bastante a sua habilidade para decidir, de forma mais precisa, que tipo de objeto celeste é que estava a catalogar”, refere Andrew Humphrey.

Vários rastreios do céu, como o Sloan Digital Sky Survey (SDSS), produziram enormes quantidade de dados que revolucionaram a área da astronomia. Por outro lado, rastreios futuros, que serão levados a cabo por instrumentos como o Observatório Vera C. Rubin, o Dark Energy Spectroscopic Instrument (DESI), a missão espacial Euclid (ESA) ou o telescópio espacial James Webb (NASA/ESA), vão continuar a fornecer imagens cada vez mais detalhadas.

No entanto, devido ao enorme volume de dados, demoraria demasiado tempo a analisá-los através de métodos tradicionais. Estes novos métodos de inteligência artificial serão assim cruciais para analisar e tirar melhor partido desses novos dados.

“Uma das coisas mais excitantes é ver como este algoritmo nos está a ajudar a compreender melhor o Universo. O nosso método indicou-nos um caminho possível, com novos a serem criados durante o processo. É uma era excitante para a astronomia!”, refere Pedro Cunha.

Euclid: a próxima fronteira

Este trabalho está inserido no esforço da equipa para tirar partido do dilúvio de dados que esses rastreios irão produzir, ao desenvolver sistemas de machine learning que conseguem classificar e caracterizar, de forma eficiente, milhares de milhões de fontes.

Pesquisas fotométricas e espectroscópicas são uma das principais maneiras para compreendermos o conteúdo visível do Universo. Os dados destes rastreios permitem estudos estatísticos de estrelas, quasares e galáxias, além da descoberta de objetos astronómicos mais peculiares

Imagem artística da missão espacial Euclid. (Crédito: ESA/ATG medialab (satélite); NASA, ESA, CXC, C. Ma, H. Ebeling and E. Barrett (U. Hawaii/IfA), et al. e STScI (fundo))

Para Polychronis Papaderos, o investigador principal do grupo “A história da formação de galáxias resolvida no espaço e no tempo” do IA, “o desenvolvimento de avançados algoritmos de inteligência artificial, como o SHEEP, fazem parte da estratégia do IA para a exploração científica de grandes conjuntos de dados de milhares de milhões de galáxias, da missão espacial Euclid, programada para ser lançada em 2023″.

A missão espacial Euclid vai fazer uma cartografia detalhada do Universo, e procurar pistas para a natureza das enigmáticas Energia Escura e Matéria Escura. O IA coordena a participação portuguesa  no Euclid e lidera ou colidera, no consórcio do Euclid, vários grupos de trabalho nas áreas da cosmologia e da astronomia extragaláctica.