ECIR_300_200É um projeto de investigação da Faculdade de Engenharia da U.Porto (FEUP) e da SAPO e foi distinguido com o “BEST Demo Award” na European Conference on Information Retrieval (ECIR) que decorreu em Pádua (Itália). Chama-se “Máquina do Tempo” e funciona como uma ferramenta de pesquisa e visualização de arquivos de notícias da agência LUSA, focada em entidades. Trata-se de uma tecnologia pioneira na área do jornalismo computacional, criada no Laboratório SAPO/U.Porto com o objetivo de facilitar o acesso a acontecimentos históricos e às notícias que marcaram a vida de Portugal e do mundo nos últimos 25 anos.

O prémio foi obtido com base num artigo de título “TimeMachine: Entity-Centric Search and Visualization of News Archives”. O trabalho descreve uma abordagem original, que usa as entidades e as suas ligações, os dados são apresentados numa linha do tempo que permite viajar e enquadrar a pesquisa no ano ou mês das notícias. Os autores do artigo são dois estudantes do Programa Doutoral em Engenharia Informática (PRODEI) da FEUP, Pedro Saleiro (Labs Sapo UP, FEUP e LIACC – Laboratório de Inteligência Artificial e Ciência de Com

putadores), Jorge Teixeira (Labs Sapo UP, FEUP e LIACC), contando também com a co-autoria de Carlos Soares (FEUP e INESC TEC) e Eugénio Oliveira (Labs Sapo UP, FEUP e LIACC). “É uma ferramenta web dinâmica que permite aos utilizadores pesquisar por entidades através de expressões que descrevam histórias ou eventos”, explica Jorge Teixeira. O que o sistema faz é “retornar as entidades mais relevantes, suportado em abordagens automáticas de extração e indexação de perfis de entidades obtidos a partir das notícias”, continua Pedro Saleiro.

Apesar da declarada vertente jornalística, a ferramenta está disponível online para o público em geral em http://maquinadotempo.sapo.pt/.

Com coordenação de Eugénio Oliveira e Cristina Ribeiro (U.Porto) e Celso Martinho e Benjamin Júnior (SAPO), “A Máquina do Tempo” resulta de um conjunto de projetos que nos últimos oito anos decorreram no Laboratório SAPO/U.Porto. Esses projetos serviram para resolver problemas específicos, como, por exemplo, a identificação e desambiguação das individualidades  mencionadas nas notícias. As áreas científicas envolvidas incluem extração de informação de texto, visualização de informação, pesquisa multimédia, análise de sentimentos, recomendação musical, deteção de opiniões nos media sociais e análise de relações em redes, sendo que todos os projetos exploram grandes coleções de dados, de que são exemplo notícias, blogues, imagens jornalísticas, músicas e mensagens na rede social Twitter.