INESC TEC desenvolve solução para combater fake news

No início de maio, a Comissão Europeia registou, diariamente, mais de 2.700 artigos com fake news relacionadas com a covid-19 nas redes sociais, entre publicações falsas ou enganosas. E é para fazer travar fenómenos como este que o Centro de Sistemas de Computação Avançada (CRACS) do INESC TEC está a desenvolver o projeto “Detecting Fake News Automatically”, que tem como objetivo ajudar o utilizador comum, e sobretudo os jornalistas, a analisar e identificar informação com elevada probabilidade de ser falsa, e também a filtrar o conteúdo mais relevante nas redes sociais.

E como é que tudo funciona? ““O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática, que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado. Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news”, explica Álvaro Figueira, investigador INESC TEC e professor no Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).

E como é que tudo funciona? “O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado”, explica o investigador Álvaro Figueira.

“Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news”, completa o também docente do Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).

Recorrendo a técnicas de data mining, aprendizagem automática, processamento em linguagem natural, reconhecimento de entidades mencionadas, análise de sentimento, entre outras, os investigadores esperam então que a solução desenvolvida ofereça um maior grau de segurança e garantia de veracidade sobre o conteúdo que se lê nas redes sociais.

“Pretendemos que o sistema utilize a mensagem escrita do post e toda a informação associada a esta, ou seja, os likes, partilhas, comentários, bem como a informação sobre o utilizador que publicou o post. A nossa convicção é que esta informação adicional, associada à mensagem propriamente veiculada, contribua para gerar uma confiança superior na classificação dada pelo sistema”, acrescenta Álvaro Figueira.

Sistema adaptado à pendemia

Este projeto é um output do projeto REMINDS, no qual se pretendeu construir um sistema capaz de detetar automaticamente quais os posts das redes sociais (Facebook e Twitter) mais relevantes para o público em geral, de acordo com critérios jornalísticos. Uma necessidade que surgiu após as eleições norte-americanas de 2016, numa altura em que o problema das fake news ganhou uma maior dimensão e em que empresas tecnológicas e a comunidade científica começaram a trabalhar numa solução. No contexto pandémico atual, há variáveis que mudam e é necessário adaptar o sistema a novos desafios.

“Um dos principais desafios que o projeto enfrenta é a mudança de domínio e contexto temporal em que uma fake news pode surgir. Por exemplo, uma fake news num contexto político tem algumas propriedades textuais e lexicais diferentes de uma fake news num contexto da saúde. Portanto, tentar desenvolver um sistema que seja capaz de capturar este tipo de diversidade tem sido uma tarefa desafiante”, nota Álvaro Figueira.

Ainda de acordo com o investigador do INESC TEC, “a pandemia por covid-19, tendo um domínio e contexto específicos, tem sido um caso de estudo muito interessante no universo das fake news. Mas acreditamos que o sistema será capaz de adaptar-se e detetar fake news em qualquer domínio, contribuindo para mitigação deste tipo de conteúdos nas redes sociais”.

No âmbito deste projeto está ainda a ser desenvolvida pelo investigador do INESC TEC, Nuno Guimarães, a tese com o título “Analyzing and Developing Veracity Indicators for Building an Automatic Detector of Fake News Online”. A tese, em desenvolvimento na FCUP, é supervisionada pelos investigadores do INESC TEC Álvaro Figueira e Luís Torgo

Cookie	Duração	Descrição
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gat_gtag_UA_134620246_2	1 minute	Set by Google to distinguish users.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.
CONSENT	2 years	YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.
iutk	5 months 27 days	This cookie is used by Issuu analytic system. The cookies is used to gather information regarding visitor activity on Issuu products.

Cookie	Duração	Descrição
_fbp	3 months	This cookie is set by Facebook to display advertisements when either on Facebook or on a digital platform powered by Facebook advertising, after visiting the website.
fr	3 months	Facebook sets this cookie to show relevant advertisements to users by tracking user behaviour across the web, on sites that have Facebook pixel or Facebook social plugin.
mc	1 year 1 month	Quantserve sets the mc cookie to anonymously track user behaviour on the website.
VISITOR_INFO1_LIVE	5 months 27 days	A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC	session	YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt.innertube::nextId	never	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	never	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.

INESC TEC desenvolve solução para combater fake news

Sistema de deteção automática utiliza dados estatísticos e psicolinguísticos para combater a desinformação nas redes sociais.

Sistema adaptado à pendemia

Casa Comum acolhe ciclo de cinema alemão LGBTQIA+

Cientistas da U.Porto desvendam mistério secular sobre a cor dos cucos

Jardim Botânico da U.Porto inspira workshop gratuito de fotografia

Alterações climáticas podem tornar-se o principal risco à biodiversidade

Morreu António Amorim, Professor Emérito e investigador da U.Porto

50 anos do 25 de Abril: “Éramos jovens e éramos felizes no que fazíamos!”

U.Porto no “top 200” mundial em 13 áreas de estudo

João Horta Belo: um físico apaixonado pelo magnetismo

Pedro Aibéo

Helsínquia, Finlândia

Sistema adaptado à pendemia

Sugerido