O estudante do Programa Doutoral em Biologia da FCUP, Francisco Pascoal, que realiza investigação no Centro Interdisciplinar de Investigação Marinha e Ambiental (CIIMAR), integrou uma equipa internacional que desenvolveu nova ferramenta que utiliza “machine learning” – um ramo da Inteligência Artificial (IA) – para detetar automaticamente a biosfera rara em conjuntos de dados ecológicos.
Este produto, designado ulrb e desenvolvido no âmbito do seu projeto de doutoramento, responde a um desafio de longa data na ecologia microbiana: distinguir os microrganismos raros dos mais abundantes em ambientes naturais.
O trabalho contou com a orientação da docente do Departamento de Biologia e investigadora do CIIMAR, Catarina Magalhães e coorientação dos investigadores Rodrigo Costa, Instituto de Bioengenharia e Biociências (iBB) do Instituto Superior Técnico da Universidade de Lisboa e ainda Paula Branco, do School of Electrical Engineering and Computer Science of University of Ottawa (EECS), no Canadá.
Esta nova metodologia e o novo software ulrb foram recentemente publicados no estudo “Definition of the microbial rare biosphere through unsupervised machine learning” na revista científica Communications Biology. Assinam também o artigo investigadores do Faculty of Computer Science of Dalhousie University, também no Canadá.
Potencial no estudo de invasões biológicas e na monitorização ambiental
A ferramenta agora desenvolvida com base em técnicas de machine learning aumentará não só a precisão das análises ecológicas de diferentes microbiomas e ecossistemas, mas também a profundidade a que estas análises são feitas, melhorando, em última instância, a nossa compreensão da diversidade microbiana e do seu papel na resiliência dos ecossistemas. Esta pode ser usada no estudo de doenças emergentes e invasões biológicas e também para a monitorização ambiental, com a determinação de espécies de animais e/ou plantas em risco em determinados contextos.
Ao empregar técnicas de machine learning não supervisionadas, o ulrb permite aos investigadores identificar rapidamente e de forma fiável quais são os microrganismos raros de uma comunidade. Uma grande vantagem deste método é a sua adaptabilidade a diferentes contextos metodológicos, isto é, o algoritmo “aprende” os padrões presentes nos próprios dados, independentemente da sua origem.
“A possibilidade de identificar os microrganismos raros surgiu com o desenvolvimento de tecnologias de sequenciação de DNA com alto rendimento, mas mesmo com esses dados nunca foi claro entre os pares como identificar os microrganismos raros, pois estes eram ofuscados pelos abundantes. Assim, muitos investigadores limitavam-se a estabelecer níveis aleatórios de abundância, que era uma abordagem insuficiente uma vez que não era suportada por uma justificação biológica. Com este novo método, conseguimos usar dados de sequenciação para distinguir de forma automática quais são os microrganismos raros, com base na informação disponibilizada em cada amostragem”, afirma Francisco Pascoal, primeiro autor do estudo.
Para a automatização criou-se um algoritmo que agrupa os microrganismos mais semelhantes entre si, relativamente à sua abundância numa dada amostra. Como se baseia na distância relativa entre eles, pode ser automatizado e aplicado a bases de dados de qualquer tamanho, e produz um resultado com valor ecológico e biológico rigoroso e uniforme. “No fundo, o algoritmo “aprende” quais são os grupos de abundância numa comunidade e faz a correspondência entre eles e uma classificação de abundância, que permite distinguir os microrganismos que são raros dos que são abundantes” remata.
A importância de estudar microrganismos raros
As comunidades microbianas seguem normalmente um padrão em que apenas algumas espécies são altamente abundantes, enquanto a grande maioria da diversidade é pouco abundante e pertence à chamada “biosfera rara”. Na verdade, são milhares o número de espécies de microrganismos procariotas que podem habitar 1 L de água marinha. No entanto, apenas 2 a 5% dessas espécies são abundantes, sendo as restantes raras e muito difíceis de detetar e identificar devido a limitações metodológicas.
Apesar de pouco abundantes, as espécies raras contêm em si a maior diversidade genética do planeta e são elas que fornecem grande resiliência a um ecossistema. Segundo explica Francisco Pascoal, “se as espécies mais abundantes ficarem ameaçadas pelas alterações climáticas, outras espécies raras podem assumir o controlo e assegurar as funções do microbioma, mantendo o ecossistema estável”.
A biosfera rara tem, por isso, um papel muito relevante nas respostas dos ecossistemas a grandes alterações do meio, como é o caso dos efeitos das alterações climáticas. “Estudar os organismos raros permite-nos conhecer a resiliência dos ecossistemas a estas mudanças e estudar a sua reação às alterações do meio”, destaca o estudante.
Os investigadores que quiserem aplicar esta ferramenta aos seus próprios dados poderão fazê-lo facilmente, uma vez que o ulrb está disponível como um pacote R de código aberto no CRAN e no GitHub. A equipa de investigadores criou também uma página Web com materiais de aprendizagem para incentivar à utilização da ferramenta.