Carlos Alberto Ramos
Corecon-DF nº 3864.
Diariamente escutamos ou lemos que os casos/internações/mortos no dia, pela COVID, são x. A divulgação desse dado é seguida de comentário que explica que não foi bem assim, que a estatística divulgada corresponde à contabilização do dia, mas, na realidade, muitas dessas ocorrências foram anteriores e algumas vezes muito anteriores. Talvez o caso mais notório sejam os dados do fim de semana, sub-contabilizados por serem dias de folga, sendo carregados em registros de dias seguintes. Essa evidente fragilidade nas informações tenta ser contornada mediante avaliações que consideram não o dado pontual, mas a média móvel de 7 dias, esforço válido que não reverte totalmente o problema. Com efeito, essa técnica só permite desazonalizar parcialmente (sazonalidade semanal). Uma vez que a contabilização diária pode incluir ocorrências mais antigas e não obedecem a dada sazonalidade senão a fatores aleatórios, o problema é minimizado, mas persiste.
Pode ser desnecessário ressaltar a relevância de informações bem datadas no caso da pandemia. Políticas públicas ou alterações comportamentais só podem ser avaliadas na sua eficácia se as estatísticas disponíveis representarem bem (até perfeitamente) o período temporal no qual ocorreram, e esse não é o caso dos dados da COVID.
Qual a raiz do problema? Basicamente que a fonte de dados sobre a qual são contabilizadas as informações referentes à pandemia são Registros Administrativos (RA’s) e não pesquisas desenhadas para gerar estatísticas robustas e confiáveis.
RA’s contabilizam fatos. O objetivo primário de todo RA não é produzir estatísticas, ainda que sejam aproveitados para esse fim. Os exemplos de RA’s que são utilizados para gerar séries de dados são os mais diversos. Por exemplo, mensalmente são divulgadas, pelo Ministério da Economia, as admissões, desligamentos e saldo de parte do mercado formal de trabalho (assalariados com carteira). A fonte de dados é o CAGED (Cadastro Geral de Empregados e Desempregados), um RA utilizado para o pagamento e controle do seguro-desemprego. O benefício do Abono Salarial é administrado via RAIS (Relação Anual de Informações Sociais), RA que assemelhado a um censo anual do mercado formal de trabalho (empregados com carteira + estatutários). O fim último de um RA não é produzir estatísticas, não é essa sua vocação. Contudo, à medida que contém grande cobertura, a tentação de serem utilizados como base de dados para a construção de estatísticas é justificada. Na prática, com o tempo, essa “vocação torta” se tornou predominante e hoje a RAIS e o CAGED são popularmente assumidos mais como uma fonte estatística que como RA’s utilizados no gerenciamento de programas governamentais.
Contudo, além de seu DNA não ser a produção de bases de dados, o contexto institucional no qual são gerados, administrados e divulgados os RA’s não coadjuvam para torná-los tecnicamente robustos. Os indivíduos que preenchem os formulários distam de ser estatísticos ou com formação próxima, e suas preocupações e objetivos estão distantes da oferta de dados. Um médico preenchendo um formulário das causas dos decessos ou um empresário completando um formulário do CAGED ou da RAIS assumirão essas tarefas como um obstáculo à realização de suas atribuições primordiais. Poderíamos fazer considerações semelhantes sobre os burocratas que administram bancos de dados nas instituições. Por último, e não menos importante (especialmente no caso da COVID), as instituições que administram os RA’s têm uma relação umbilical com o poder de turno e, nesse sentido, carecem da reputação necessária para transmitir uma imagem de neutralidade ou isenção. Este fato, além de nutrir desconfiança, cria o ambiente para que outras instituições (Justiça ou a sociedade civil) questionem os dados divulgados e tentem (com maior ou menor êxito) alterar o perfil das informações divulgadas.
Historicamente, as limitações dos RA’s foram notórias e receberam algum tipo de tratamento estatístico, segundo o caso. Por anos a RAIS foi vista com desconfiança pelas evidentes incoerências na sua comparabilidade intertemporal. Em sua história, a metodologia do CAGED foi diversas vezes alterada, sem que as razões e justificativas fossem explicitadas. Mas, mesmo com aprimoramentos, um RA deve, necessariamente, passar pelo crivo da consistência estatística antes de sua divulgação. Em nenhuma circunstância as informações brutas contidas em um RA podem alimentar uma base de dados, especialmente quando a mesma for utilizada por um público leigo.
No polo oposto aos RA’s há as pesquisas desenhadas com o propósito de construir sólidas bases de dados. Neste caso referenciamos a PNAD (Pesquisa Nacional por Amostra de Domicílios), a POF (Pesquisa de Orçamentos Familiares), a PED (Pesquisa de Emprego e Desemprego). Além de serem desenhadas para montar bases de dados, as instituições que as imaginam, produzem e divulgam têm como vocação principal a produção de estatísticas, seja no âmbito estatal (IBGE) seja na sociedade civil (DIEESE/PED). O corpo técnico que as gera e administra tem o perfil profissional requerido para essas tarefas. Por óbvio, o desenho de uma base de dados ou a sua de divulgação não estão alheios a polêmicas e debates (lembremos a discussão entre a extinta PME-Pesquisa Mensal de Emprego, do IBGE, e a PED). Contudo, a controvérsia gira em torno a aspectos preponderantemente técnicos, metodológicos ou teóricos, quase não existindo espaço para debates de cunho opinativo. A reputação institucional do produtor das informações inibe impugnações. Por exemplo, só alguém com reconhecido gabarito técnico ousaria questionar a POF/IBGE.
No caso dos dados da COVID, lamentavelmente parece que todos os elementos negativos relativos aos RA’s como base estatística confluíram. Por exemplo, os dados são contabilizados quando chegam e não no dia de competência (ocorrência do evento). Este erro é primário e existe experiência nacional a respeito. O CAGED, p.ex., divulga uma série ajustada com informações atrasadas, corrigindo dados já divulgados. Contudo, consciente que pode existir defasagem entre o momento em que ocorreu um fato e o recebimento da informação, nunca será atribuído a um ponto no tempo um fato ocorrido em outro momento. Em outras áreas é adotado procedimento similar. Quando, em dado momento, o PIB é divulgado são corrigidos valores anteriores, mas nunca carregados ajustes do passado no valor presente. Assumir esse procedimento não encontra justificativa técnica e introduz viés na trajetória temporal da série.
A esse elementar erro metodológico se agrega a falta de reputação da instituição (Ministério da Saúde) na qual os dados são gerados e divulgados que, como já afirmamos, é outra potencial fragilidade dos RA’s. Nesse sentido, qualquer alteração metodológica pode ser assumida como uma tentativa de ocultar ou distorcer informações e não como uma genuína tentativa de aprimorar tecnicamente a fonte de dados (supondo que esse seja mesmo o objetivo). Na ausência de autoridade técnica da instituição que administra e divulga os dados é criado o ambiente para outras instâncias (com menos qualificações técnicas na área, Justiça ou imprensa não especializada) intervirem.
Equacionar o problema passaria pela centralização na produção e divulgação de estatísticas (mesmo as de RA’s) por uma instituição com reputação e qualidade técnica e vocacional para produzir estatísticas. Óbvio que o candidato natural é o IBGE. Erros e desconfianças seriam evitados com essa alternativa.
Carlos Alberto Ramos, é Professor do Departamento de Economia, UnB.
“Os conteúdos dos textos publicados, artigos e notas, além dos comentários do público, são de responsabilidade exclusiva de seus autores e signatários, não envolvendo ou refletindo posicionamentos ou opiniões do CORECON-DF.”