O trabalho é de 2022, mas acaba agora de ser premiado com o “Mathematics Best Paper Award“, um prémio atribuído pela revista científica “Mathematics”, do grupo de publicações suíço Multidisciplinary Digital Publishing Institute (MPDI), às publicações consideradas de alta qualidade, de relevância científica e mais influentes entre os cientistas. O mérito é dos investigadores Álvaro Figueira, professor no Departamento de Ciência de Computadores da FCUP e Bruno Vaz, mestre em Ciência de Dados pela FCUP, que assinam o artigo “Survey on Synthetic Data Generation, Evaluation Methods and GANs“.

Publicado na Mathematics, em 2022, e tendo sido a Escolha do Editor, o artigo foi um dos seis selecionados pelo comité de avaliação e ocupa o 2º lugar entre eles, tendo conquistado um prémio no valor de 500 francos suíços (aproximadamente 500 euros). De acesso aberto, o estudo oferece uma forte revisão da literatura ao combinar dois tópicos importantes na área do machine learnings: o uso de dados gerados artificialmente e de boa qualidade para operações de aprendizagem automática e as redes generativas adversárias (GANs).

“Redes generativas adversárias (GANs) são modelos generativos profundos, de última geração, que permitem gerar amostras sintéticas seguindo a distribuição subjacente do conjunto de dados original. Muitas revisões sobre geração de dados sintéticos e sobre GANs já foram escritas, e abundam na literatura. No entanto, até ao momento de escrita deste artigo, nenhuma combinou explicitamente estes dois tópicos. Assim, o nosso trabalho pretendeu preencher essa lacuna e fornecer material útil para nova investigação na área”, explica Álvaro Figueira, que, em 2022, foi orientador da dissertação de mestrado de Bruno Vaz.

No trabalho, considerado entre os artigos de revisão, é apresentada informação detalhada sobre os autores e as revistas científicas mais relevantes na área, os artigos mais citados, as áreas de investigação mais significativas e as arquiteturas GAN mais relevantes de modo a focar a investigação. “As GANs, em particular, foram exaustivamente revistas, bem como os seus problemas de treino mais comuns e os seus avanços mais importantes, tendo sido dado um foco particular nas arquiteturas para geração de dados tabulares. Foram também revistos e analisados os principais algoritmos para gerar dados sintéticos e os principais datasets criados, com as suas particularidades”, acrescenta o docente da FCUP.

Foram considerados, para este prémio recentemente atribuído por este jornal científico com fator de impacto 2.4, todos os artigos publicados nessa revista entre 1 de janeiro e 31 de dezembro de 2022 e tidos em conta também critérios como a originalidade e o número de downloads.