Ir para conteúdo

Gerando Alfa com dados não estruturados

Tim Gaumer
Tim Gaumer
Director of Innovation and Fundamental Research

Se os dados são agora a mercadoria mais valiosa que temos, como devem ser usados ​para obtermos retornos cada vez maiores? Neste post, conheça mais sobre a abordagem “quantamental”, que se baseia em dados não estruturados e associa a pesquisa de investimento fundamental à quantitativa.


  1. A imensa quantidade de dados de que dispomos atualmente precisa ser transformada em conteúdo estruturado para pesquisas de investimento.
  2. Os Refinitiv Labs vêm trabalhando para organizar dados ainda não estruturados. Fazemos isso usando Inteligência Artificial, Machine Learning, Processamento de Linguagem Natural (PLN) e dados de texto.
  3. Muitas empresas estão adotando uma nova abordagem, apelidada de “quantamental”, que mistura pesquisas fundamentais e quantitativas para criar uma ferramenta poderosa em busca de maiores retornos com dados não estruturados.

Os dados são agora chamados de “o novo petróleo”, ou seja, a mercadoria mais valiosa do mundo. E a ampla experiência da Refinitiv com dados fundamentais estruturados, não estruturados e alternativos, bem como Inteligência Artificial, vai de encontro à maneira como o setor de investimentos está começando a trabalhar com esses recursos.

Nesse ambiente, no entanto, tem sido cada vez mais difícil selecionar bons investimentos. Os retornos excedentes, ou Alfa, antes considerados como evidência de habilidade dos profissionais, agora podem ser atribuídos simplesmente à alocação de fatores.

Os desafios enfrentados atualmente pelos gestores de investimento incluem manter-se à frente das mudanças: tanto de alfa para beta quanto de estratégias ativas para passivas.

Prevendo a qualidade dos ganhos

Uma maneira de gerar Alfa é aprimorar anomalias e fatores de risco conhecidos, ou mesmo criar novos fatores com base em anomalias descobertas ou em fontes de dados menos tradicionais. Independentemente desses fatores de risco e de exposições, misturá-los funciona sempre melhor do que quando adotamos qualquer solução independente.

Um exemplo: além dos dados de competência, o fluxo de caixa livre e os retornos operacionais parecem fazer um melhor trabalho na previsão da qualidade dos ganhos.

Ao considerar as revisões dos analistas, em vez de apenas observar as mudanças no consenso de EPS, analise também a demonstração de resultados para incluir EBITDA e receita –e em vários períodos, não apenas no trimestre atual.

Outra solução é ir além das anomalias conhecidas e criar novas, como um modelo de participação que se baseia em dados de propriedade usando registros federais como 13Fs, onde investidores institucionais relatam participações em carteira.

O modelo que criamos analisa o que os grandes investidores acrescentaram a seus portfólios mais recentemente e as características subjacentes a essas compras para identificar suas novas telas de geração de ideias.

Utilizando dados não estruturados

Muitas empresas estão agora mesclando análise de pesquisa fundamental com quantitativa em uma abordagem que vem sendo chamada de “quantamental”.

Entretanto, é muito mais fácil criar esses modelos quantitativos a partir de dados bem estruturados, como demonstrações financeiras corporativas. Mas hoje, 80% dos dados ainda não são estruturados, e precisam ser convertidos.

Em todo o mundo, os Refinitiv Labs vêm trabalhando para organizar dados ainda não estruturados. Fazemos isso usando Inteligência Artificial, Machine Learning, Processamento de Linguagem Natural (PLN) e dados de texto. Um exemplo disso é o uso de texto não estruturado e Machine Learning para avaliar o risco de crédito e a probabilidade de inadimplência de uma determinada empresa.

Nosso modelo trabalha com transcrições de teleconferência da StreetEvents, registros das empresas, feed de notícias da Reuters e pesquisas de corretoras selecionadas.

Cada tipo de documento é tratado de forma diferente. Isso porque a linguagem muda dependendo se o autor é, por exemplo, um advogado, jornalista ou analista do sell-side

Então, o texto do documento é transformado em um perfil no qual as empresas recebem uma classificação: 1 para aquelas com mais riscos, e 100, para as com menos –tudo com base na probabilidade percentual de inadimplência nos próximos 12 meses.

A abordagem quantitativa

Quando o modelo foi criado, em 2011, ele analisava “um pacote de palavras”, atribuindo um valor a termos como “possíveis violações do contrato”. Hoje, nossa ferramenta aplica técnicas de Deep Learning para aperfeiçoar os modelos de risco de crédito.

Grandes redes neurais estão sendo empregadas para trabalhar em um conjunto maior de idiomas (em vez de apenas conjuntos de palavras) para que elas tentem criar seus próprios dicionários de palavras e frases perigosas.

Qual é o futuro dos dados? É inegável que a área quantamental” está crescendo, principalmente se comparada a uma abordagem puramente discricionária, ou totalmente quântica, na qual um computador é ensinado a selecionar as melhores ações do mercado.

O segredo para o sucesso é a uma mistura entre humanos mais inteligentes e máquinas mais inteligentes.

O QA Direct fornece acesso a uma enorme variedade de conteúdo, pronto para uso em análise quantitativa