Logo O POVO Mais

Agregador de Pesquisas

Metodologia

Ferramenta permite que pesquisas eleitorais sejam agregadas e mostra tendências de voto mais próximas da realidade para as eleições de 2022.

Por

Em meio às comemorações dos dois anos do O POVO Mais, a Central de Jornalismo de Dados (DATADOC) lança o Agregador de Pesquisas O POVO. Ao compilar os resultados das sondagens divulgadas por diferentes institutos de pesquisa e aplicar medidas estatísticas como média e média móvel, a ferramenta permite avaliar as tendências apresentadas pelas pesquisas eleitorais a partir de uma perspectiva mais ampla.

Como forma de manter a transparência, a reprodutibilidade e a credibilidade, a DATADOC disponibiliza aqui a metodologia utilizada para a construção da ferramenta e para o cálculo dos indicadores que a compõem.

Neste notebook, os leitores podem ter acesso aos dados coletados e conhecer o passo a passo seguido pela equipe da Central para chegar aos resultados e às análises apresentadas. Esta versão apresenta os códigos em javascript, e uma documentação em python será publicada, em breve, no perfil da Central DATADOC no Github.

Em caso de dúvidas ou sugestões, entre em contato conosco pelo seguinte e-mail: datadoc@opovodigital.com.br

Fonte e coleta de dados

Coletamos na página Consulta às pesquisas registradas, do TSE, as principais informações das pesquisas realizadas pelos oito institutos que formam a base de pesquisas do Agregador O POVO. Em seguida, buscamos os resultados de cada pesquisa em portais oficiais e páginas de notícias.

Em nosso universo de pesquisas exploradas, consideramos as intenções de voto para os cargos majoritários (Senado, Governo e Presidência) de pesquisas estimuladas em todo o Brasil em seus múltiplos cenários para o 1º e 2º turnos, como também a rejeição dos candidatos e a avaliação e aprovação do Presidente / Governo Federal.

Bases de dados

Na própria ferramenta, além de visualizar graficamente os dados ao simular os diversos cenários possíveis, o leitor pode baixar os arquivos criados a partir da coleta realizada pela Central DATADOC junto aos oito institutos de pesquisa. Os dados estão disponíveis — com atualização frequente — em formato aberto (.csv), em duas bases: Pesquisas Registradas e Resultados Divulgados.

Para analisar o código e uma descrição mais detalhada da coleta e tratamento de dados, acesse o notebook com a metodologia completa do projeto neste link no Observable.




Para calcular as tendências expressas no Agregador de Pesquisas O POVO, seguimos os seguintes passos:

  1. Definição de um cenário
  2. Pesos e médias diárias
  3. Média móvel ponderada

Vamos testar? Apresentamos a seguir os códigos e cálculos de cada uma dessas etapas em um exemplo prático.

Definição de um cenário:

Para executar o cálculo de tendências propriamente dito, precisamos, em primeiro lugar, definir um universo de resultados que serão utilizados (turno, cargo, tipo de pesquisa, abrangência e/ou institutos de pesquisas - selecionados pelo leitor).

Utilizaremos, neste exemplo, as pesquisas de Intenção de Voto para Presidente no 1º Turno. Outros cenários, como a aprovação e avaliação do governo e a rejeição dos candidatos, seguirão os mesmos cálculos e métricas.

Vamos calcular a tendência de apenas 1 candidato neste cenário, para facilitar a compreensão da metodologia.

Para continuar, selecione um candidato:

Pesos e médias diárias

Nesta etapa, executamos os seguintes passos:

  • Em dias com uma ou mais pesquisas, calculamos a média simples das pontuações do candidato.
  • Para os dias subsequentes sem pesquisas registradas, atribuímos a pontuação do candidato no dia imediatamente anterior.
  • Por fim, atribuímos um peso referente ao número de cenários testados para o candidato em cada dia. Desta forma, dias com mais pesquisas terão uma influencia superior no próximo passo.

Exemplo: Se hoje o candidato “A” aparece em 5 cenários e ontem apareceu em 3, a sua pontuação de hoje terá um peso 5 e a pontuação de ontem terá um peso 3 para a próxima etapa. Para os dias sem pesquisas registradas, em que a média diária segue o valor do dia anterior, atribuímos o peso 1.

Gráfico dos pesos e médias diárias
Cálculo da média móvel ponderada

Na etapa final do agregador calculamos a média móvel ponderada dos últimos 30 dias, considerando as médias diárias e os pesos atribuídos nos passos anteriores.

Desta forma, garantimos que os dias com mais pesquisas tenham maior relevância e que resultados muito discrepantes tenham o impacto reduzido nas linhas de tendência do agregador.

Além disso, neste período em que a frequência de pesquisas publicadas pelos institutos utilizados é baixa, uma janela de tempo de 30 dias consegue minimizar o impacto de períodos com poucas pesquisas coletadas.

É possível alterar, no filtro abaixo, a janela de tempo utilizada na média móvel e visualizar as mudanças no resultado:

Gráfico da média móvel ponderada