No início de maio, a Comissão Europeia registou, diariamente, mais de 2.700 artigos com fake news relacionadas com a covid-19 nas redes sociais, entre publicações falsas ou enganosas. E é para fazer travar fenómenos como este que o Centro de Sistemas de Computação Avançada (CRACS) do INESC TEC está a desenvolver o projeto “Detecting Fake News Automatically”, que tem como objetivo ajudar o utilizador comum, e sobretudo os jornalistas, a analisar e identificar informação com elevada probabilidade de ser falsa, e também a filtrar o conteúdo mais relevante nas redes sociais.
E como é que tudo funciona? ““O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática, que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado. Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news”, explica Álvaro Figueira, investigador INESC TEC e professor no Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).
E como é que tudo funciona? “O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado”, explica o investigador Álvaro Figueira.
“Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news”, completa o também docente do Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).
Recorrendo a técnicas de data mining, aprendizagem automática, processamento em linguagem natural, reconhecimento de entidades mencionadas, análise de sentimento, entre outras, os investigadores esperam então que a solução desenvolvida ofereça um maior grau de segurança e garantia de veracidade sobre o conteúdo que se lê nas redes sociais.
“Pretendemos que o sistema utilize a mensagem escrita do post e toda a informação associada a esta, ou seja, os likes, partilhas, comentários, bem como a informação sobre o utilizador que publicou o post. A nossa convicção é que esta informação adicional, associada à mensagem propriamente veiculada, contribua para gerar uma confiança superior na classificação dada pelo sistema”, acrescenta Álvaro Figueira.
Sistema adaptado à pendemia
Este projeto é um output do projeto REMINDS, no qual se pretendeu construir um sistema capaz de detetar automaticamente quais os posts das redes sociais (Facebook e Twitter) mais relevantes para o público em geral, de acordo com critérios jornalísticos. Uma necessidade que surgiu após as eleições norte-americanas de 2016, numa altura em que o problema das fake news ganhou uma maior dimensão e em que empresas tecnológicas e a comunidade científica começaram a trabalhar numa solução. No contexto pandémico atual, há variáveis que mudam e é necessário adaptar o sistema a novos desafios.
“Um dos principais desafios que o projeto enfrenta é a mudança de domínio e contexto temporal em que uma fake news pode surgir. Por exemplo, uma fake news num contexto político tem algumas propriedades textuais e lexicais diferentes de uma fake news num contexto da saúde. Portanto, tentar desenvolver um sistema que seja capaz de capturar este tipo de diversidade tem sido uma tarefa desafiante”, nota Álvaro Figueira.
Ainda de acordo com o investigador do INESC TEC, “a pandemia por covid-19, tendo um domínio e contexto específicos, tem sido um caso de estudo muito interessante no universo das fake news. Mas acreditamos que o sistema será capaz de adaptar-se e detetar fake news em qualquer domínio, contribuindo para mitigação deste tipo de conteúdos nas redes sociais”.
No âmbito deste projeto está ainda a ser desenvolvida pelo investigador do INESC TEC, Nuno Guimarães, a tese com o título “Analyzing and Developing Veracity Indicators for Building an Automatic Detector of Fake News Online”. A tese, em desenvolvimento na FCUP, é supervisionada pelos investigadores do INESC TEC Álvaro Figueira e Luís Torgo