O Refinitiv Labs desenvolveu um rastreador de notícias corporativas, o Covid-19 Company News Tracker, para ajudar nossos clientes a identificar tanto potenciais perigos quanto possibilidades de negócios em dados provenientes da mídia.
- Com o Covid-19 Company News Tracker, projetado pelo Refinitiv Labs, é possível filtrar o grande volume de informações existentes sobre a pandemia para encontrar riscos e oportunidades em dados provenientes de notícias.
- Essa nova ferramenta, baseada em machine learning (ML) e processamento de linguagem natural (PLN), pode fornecer insights para nos ajudar a lidar com eventos imprevistos de alto impacto, como esta pandemia de coronavírus, que geram picos de incertezas nos mercados financeiros.
- Para se informar mais sobre o novo rastreador de notícias, acesse o nosso Learn-it-all Lab virtual.
Na esteira da crise sanitária mundial, surgiu um volume avassalador de notícias sobre empresas, indústrias e cadeias de suprimentos, o que impôs aos clientes da Refinitiv o desafio de detectar, em meio a todas essas referências, sinais que os ajudem a gerenciar riscos e promover resiliência.
A análise de dados provenientes de fontes como a Organização Mundial da Saúde (OMS) ou de provedores tradicionais de notícias não geram os insights necessários para que se tomem decisões de negócios mais bem embasadas, independentemente do setor de atuação.
Desenvolvemos o Covid-19 Company News Tracker para fornecer sinais de série temporal relacionados ao Coronavirus, permitindo assim que os clientes se concentrem em empresas e setores de seu interesse e identifiquem rapidamente oportunidades e riscos.
A equipe por trás desse novo protótipo do Refinitiv Labs conta com uma série de especialistas que, trabalhando em conjunto, conseguiram criar o app com extrema rapidez: apenas dez semanas da concepção inicial à sua completa implantação.
A importância do feedback dos usuários
O novo projeto foi desenhado em colaboração com os nossos clientes, garantindo que as soluções propostas fossem realmente relevantes e, sobretudo, de alta qualidade. Envolvemos, desde o início, estrategistas, economistas, traders, gestores de patrimônio, analistas de empresas e especialistas em dados, e fomos compartilhando nossos avanços com a clientela.
O feedback dos clientes foi essencial para nos informar sobre a funcionalidade e a interface do usuário do aplicativo, além de fornecer casos de uso adicionais para o modelo de machine learning sobre o qual o protótipo se baseia.
Anotações rigorosas
O segredo da eficácia de nosso rastreador são dados de notícias precisos, de alta qualidade e oportunos. Eles são originários do Refinitiv News Archive, e hospedados em um banco de dados destinado especificamente ao aplicativo. Esses dados foram filtrados de 150.000 artigos de notícias publicados desde novembro de 2019 –todos relacionados a Covid-19.
Observações rigorosas sobre os dados foram fundamentais para garantir que o modelo de ML fornecesse resultados significativos. Essas anotações foram um esforço de equipe. Trabalhamos inicialmente de forma iterativa em cem artigos (como exemplo) para descobrir se as matérias sobre a Covid-19 mencionavam a palavra “risco”, “oportunidade” ou nenhuma delas.

Depois que um método consistente foi implementado, outos 7.500 artigos –também para exemplo— foram anotados pela equipe.
Conjuntos de dados adicionais da Refinitiv e serviços utilizados para a criação do Covid-19 Company News Tracker incluem:
- Thomson Reuters Business Classification (TRBC), uma classificação abrangente de setores e indústrias.
- Refinitiv Knowledge Graph, a Proof of Concept (PoC) disponível no Data Exploration Tool.
- Fundamentos das empresas fornecidos pela Refinitiv.
- Refinitiv Intelligent Tagging, que usa PLN, análise de texto e mineração de dados para extrair significado de grandes quantidades de conteúdo não estruturado.
Associação do ML ao PLN
O modelo de machine learning que sustenta o Covid-19 Company News Tracker baseia-se em uma ferramenta de rastreamento de risco pré existente, também projetada pelo Refinitiv Labs. O rastreador de risco original –treinado ao longo de quatro milhões de artigos de notícias da Refinitiv— era programado para captar riscos financeiros, ambientais e operacionais.
O que fizemos foi reduzir o foco do antigo rastreador para que agora se concentrasse na Covid-19 e em questões materiais de riscos e oportunidades, produzindo assim um novo modelo.
A nova versão é baseada nos modelos de PLN de código aberto do Google, chamda BERT (Bidirectional Encoder Representation from Transformers), um modelo de linguagem neural que gera representações de linguagem. O BERT é pré-treinado em 3,3 bilhões de palavras de domínio geral, que incluem Wikipedia e o conjunto de dados BookCorpus.
Assista “The Economic Impact of Coronavirus: What Can News Data Tell Us?
Treinamento de um novo BERT
Embora uma versão genérica do BERT esteja disponível, o Refinitiv Labs usou 2,7 milhões de palavras relevantes do Refinitiv News Archive para pré-treinar um novo modelo de BERT (BERT-RNA) e sintonizá-lo com a linguagem das notícias. O BERT-RNA foi então ajustado de acordo com os exemplos de 7.500 artigos sobre os quais fizemos anotações para focar em Covid-19.
Com esses recursos, o Covid-19 Company News Tracker lê automaticamente as notícias para determinar se um artigo contém riscos ou oportunidades relacionados a Covid-19 para as empresas ou setores mencionados.

O rastreador da Refinitiv está disponível no app MacroVitals, no Eikon e no Workspace, e permite que os usuários realizem pesquisas sobre empresas e setores para:
- Rastrear tendências de risco e oportunidades ao longo do tempo e comparar os resultados das empresa com os de seus pares.
- Analisar riscos e oportunidades mencionados em reportagens sobre cadeias de suprimentos.
- Ler as últimas notícias e histórias relevantes de acordo com a área de interesse.

Agilidade na criação de modelos de ML
Investir tempo em treinamento e mínimos ajustes do novo rastreador aumentou a capacidade do Refinitiv Labs de aprimorar não só esse produto, mas de desenvolver outros modelos no futuro, e em velocidade cada vez maior.
No momento, estamos investigando uma série de potenciais melhorias para o Covid-19 Company News Tracker, incluindo a capacidade de determinar a natureza temporal das notícias ou de mostrar aos clientes quando os dados se relacionam a eventos passados, em andamento ou mesmo a desenvolvimentos esperados no futuro.
No longo prazo, eventos imprevistos e de alto impacto continuarão a criar volatilidade nos mercados financeiros. E os clientes da Refinitiv que usam os modelos de ML do Labs terão a vantagem de poder “ler” qualquer situação rapidamente e responder a ela com agilidade e segurança.
A Refinitiv está agora no Telegram! Receba atualizações diárias de análises de mercado em seu celular. Inscreva-se em t.me/Refinitiv