É cada vez maior o volume de informação genética e genómica de indivíduos humanos, essencial a estudos genéticos em hospitais e centros de investigação relativamente a doenças complexas como o cancro ou Alzheimer e também a doenças raras. Cresce também a exigência de uma elevada capacidade computacional e por isso são utilizados serviços externos na nuvem – numa plataforma semelhante a um “Google Cloud” – para alojamento e análise destes dados. O problema? A privacidade.
O docente e investigador do Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP), Pedro Gabriel Ferreira, em conjunto com investigadores da Universidade do Minho e do INESC TEC, apresentou recentemente uma solução para este problema. A Gyosa, descrita num estudo publicado no prestigiado IEEE Journal of Biomedical and Health Informatics, pode ter aplicação direta em Estudos de Associação Genómica Ampla – os Genome Wide Association Studies (GWAS) – uma técnica utilizada para identificar associações entre variações genéticas e fenótipos de interesse, que podem estar ligadas a uma determinada doença.
O objetivo desta ferramenta é dar resposta a “sérias preocupações ao nível da privacidade, dado o caráter altamente sensível dos dados genéticos”, explica o investigador no Laboratório de Inteligência Artificial e Apoio à Decisão, do INESC TEC. “Podemos estar a falar de informações de DNA de uma determinado indivíduo indicativas de possíveis de doenças ou até de informação sobre relações familiares”, exemplifica.
A ideia da Gyosa é aumentar a segurança na informação, ao mesmo tempo que facilita a realização destes estudos, tornando as análises mais rápidas e eficientes.
“Propomos uma solução que assegura a privacidade das análises, mesmo quando realizadas em infraestruturas não totalmente confiáveis, aliando o desempenho à proteção dos dados”, descreve ainda Pedro Gabriel Ferreira.
Este trabalho poderá ser útil a grandes consórcios de investigação, uma vez que há uma maior necessidade de partilha de dados de diferentes parceiros e maior probabilidade de uso do sistema de nuvem.
O que a equipa propõe é um sistema que analisa a informação de forma mais segura, rápida e eficiente: “Criamos um ambiente para o qual são copiados os dados de forma segura e encriptada de um servidor para um servidor remoto. O trabalho é distribuído por múltiplos servidores em computadores “virtuais”, o que torna o processo de análise mais eficiente”, explica o investigador.
“Pode também ser facilmente adaptada para incluir novas análises, como testes estatísticos ou de imputação genética”, conta o docente da FCUP.
Os próximos passos desta investigação incluem a integração na análise de novos tipos de dados genómicos gerados para um mesmo indivíduo. “A ideia será expandir a plataforma para suportar novas tarefas na análise genómica, com diferentes tipos de dados ómicos, eventualmente submetidos para análise de forma independente, mas processados de forma integrada, dando garantias da privacidade dos dados”, detalha Pedro Gabriel Ferreira.
São também autores deste trabalho os investigadores do Laboratório de Software Confiável do INESC TEC e da Universidade do Minho, Cláudia Brito e João T. Paulo.