O investigador Agostinho Antunes, do Centro Interdisciplinar de Investigação Marinha e Ambiental da Universidade do Porto (CIIMAR-UP) e da Faculdade de Ciências da U.Porto (FCUP), integra a equipa internacional que acaba de revelar uma nova ferramenta computacional capaz de montar milhares de genomas de forma rápida e simplificada.

A nova ferramenta, acessível livremente para investigadores de todo o mundo, possibilitará responder às ambições do objetivo internacional Earth BioGenome de produzir genomas de referência para cerca de 1,8 milhões de espécies durante a próxima década, com grande impacto para a conservação.

que defende ser “uma metodologia que irá certamente alavancar o rápido avanço da montagem de genomas à escala global”.

Esta descoberta acontece num contexto marcado pelas alterações ambientais resultantes do aquecimento global e pela atual sexta extinção em massa, que colocam a biodiversidade em crise com consequências devastadoras no funcionamento e na saúde dos ecossistemas, na herança evolutiva e no potencial adaptativo das espécies, constituindo uma grande ameaça para a humanidade.

É neste momento da história que a genómica se torna altamente relevante nas avaliações da biodiversidade e nos esforços de conservação. Para isso é necessário um esforço global e em contrarrelógio, para entender os genomas da biodiversidade mundial conhecida até agora.

Earth BioGenome: uma década para produzir todos os genomas

Segundo Agostinho Antunes, “a extinção de espécies é uma perda irreparável de milhares ou milhões de anos de evolução e a compressão dos genomas dos seres vivos congrega informação fundamental”. Neste contexto, conhecer e estudar os genomas ao nível global é uma tarefa que “está no centro da ciência e de biotecnologias de ponta que impulsionam o crescimento, a produtividade, a comercialização e a competitividade global”.

Um dos objetivos do projeto Earth BioGenome passa por identificar as espécies geneticamente com maior risco de extinção para preservar a informação genética da vida. Para isso, o foi lançada a meta global de produzir genomas de referência para as aproximadamente 1,8 milhões de espécies conhecidas na terra durante a próxima década. No entanto, para cumprir esta missão, o ritmo atual de produção de genomas de referência terá de aumentar em pelo menos duas ordens de magnitude.

Na opinião de Agostinho Antunes, apesar de serem milhares os investigadores a contribuir para este objetivo, “este avanço tecnológico não se alcançará sem a automatização do processo de montagem de genomas e de um procedimento amplamente acessível a qualquer grupo de investigação”. Isto implica esforços quer para otimizar a montagem dos genomas e desenvolver boas práticas, mas também para divulgar as ferramentas existentes e munir as equipas de trabalho com infraestrutura e formação.

Professor Associado do Departamento de Biologia da FCUP, Agostinho Antunes lidera o Grupo de Genómica Evolutiva e Bioinformática do CIIMAR. (Foto: DR)

A origem da nova pipeline de produção de genomas

A otimização do processo de montagem e o desenvolvimento de melhores práticas, foi alcançado com a combinação da experiência de dois projetos – o Vertebrate Genomes Project(VGP) e o European Reference Genome Atlas (ERGA). E foi com base nestes trabalhos que a equipa internacional que integra o líder da equipa de Genómica Evolutiva e Bioinformática do CIIMAR, desenvolveu um fluxo computacional ou “pipeline” automatizado, capaz de gerar montagens de genomas quase completas de forma simples e rápida. Esta robusta ferramenta está agora descrita no artigo Scalable, accessible and reproducible reference genome assembly and evaluation in Galaxy , publicado na prestigiada revista Nature Biotechnology.

Este pipeline foi desenvolvido dentro do ecossistema Galaxy3, uma plataforma mundial de fluxo de trabalho científico cujo objetivo é tornar a biologia computacional acessível aos investigadores que não têm experiência em programação informática ou administração de sistemas.

“O Galaxy permite que os usuários executem fluxos de trabalho complexos em milhares de conjuntos de dados numa interface gráfica e de aplicações informáticas acessíveis a todo o tipo de utilizadores” explica Agostinho Antunes.

A nova pipeline não é exceção no contexto do Galaxy e foi projetada para ser útil em todo o espectro de níveis de formação do usuário e cenários de análise. Além da potentíssima ferramenta, foram criados tutoriais que permitem a formação dos utilizadores para uma mais fácil e rápida utilização desta plataforma.

Um novo aliado na conservação das espécies

Em mais detalhe, o novo pipeline combina uma série de metodologias de bioinformática colocadas de forma ordenada e automatizada, que permite chegar a montagens de genomas praticamente completas deixando para o investigador a finalização de todo o processo. Inclui ainda extensas funções de controle de qualidade e de descontaminação para garantir resultados fidedignos.

Para validação, os investigadores utilizaram 51 conjuntos de dados de vertebrados disponíveis e fizeram os primeiros testes deste fluxo de trabalho na montagem de um genoma de referência do tentilhão-zebra (Taeniopygia guttata), para o qual estão disponíveis uma ampla variedade de tipos de dados genómicos, o que permitiu legitimar a competência desta ferramenta.

Embora os conjuntos de genomas estudados sejam relativos a vertebrados, os princípios deste novo modelo podem ser aplicados a genomas de animais, plantas ou fungos, modificando apenas alguns parâmetros. A tarefa de descrever os genomas das quase 1,8 milhões de espécies eucarióticas conhecidas na terra num curto espaço de tempo fica então mais acessível, potenciando o seu impacto nas ações de conservação.

A importância de conhecer os genomas

A genómica é altamente relevante nas avaliações da biodiversidade e nos esforços de conservação, dado que a diversidade genética é fundamental para todos os níveis de organização biológica (indivíduos, populações, espécies, comunidades e ecossistemas). Mas não nos ficamos por aqui: “a genómica tem a promessa de melhorar a nossa qualidade de vida”, refere Agostinho Antunes, destacando exemplos como a monitorização de doenças genéticas, medicina de precisão com base na informação genética de cada indivíduo humano, entre outras.

Ao mesmo tempo, possuirmos informação genética também permite grandes oportunidades de desenvolvimento económico e melhoria ambiental para o benefício da sociedade em geral.

“Cada ser vivo tem um genoma que contém o código secreto da vida. Desde os alimentos que comemos, aos medicamentos e curas que procuramos, até à sustentabilidade ambiental dos recursos naturais dos quais dependemos, a genómica está atualmente a revolucionar as ciências da vida” acrescenta Agostinho Antunes.

O futuro da nova pipeline

O futuro desta potente ferramenta está também nas mãos da equipa de investigação que prevê melhorar a cada dia a sua eficiência e prevê atualizações em questões de escalabilidade, automatizações da curadoria dos dados, na incorporação de diferentes tipo de dados e procedimentos complementares que incluem tecnologias de sequenciação.

Estas melhorias preveem tornar o fluxo desta pipeline capaz de gerar genomas de referência praticamente completos e altamente precisos em tempo recorde.