O big data invadiu a economia. Isso é bom?

Com o uso de bancos de dados de diferentes fontes, o estudo econômico está ficando mais oxigenado - mas também um pouco menos transparente

São Paulo – Na saúde, no esporte, na imprensa, nas empresas… para onde quer que você olhe, o big data veio para ficar. Não poderia ser diferente na economia, onde o uso de números e mais números para provar (ou refutar) teses sempre foi regra e não exceção.

A diferença é que agora, os bancos de dados são cada vez mais complexos e têm vindo de fontes novas como empresas de tecnologia, capazes de agregar informações valiosas sobre o comportamento das pessoas.

Dois exemplos recentes: um trabalho que encontrou relação entre conteúdo de tuítes e desemprego e outros que mostram como o padrão de buscas no Google pode antecipar e refletir condições econômicas.

Essa nova fronteira permite a análise do comportamento econômico muito mais de perto e com novos critérios, mas também vem com novos desafios.

Um estudo recente de Liran Einav e Jonathan Levin, da Universidade de Stanford, analisou os trabalhos publicados pela prestigiada revista acadêmica American Economic Review nos últimos 8 anos.

Eles descobriram que a porcentagem de estudos baseados em números não disponíveis publicamente está explodindo – de menos de 8% do total em 2006 para quase metade em 2014.

Via de regra, as revistas científicas obrigam os pesquisadores a fornecer os dados que usaram para chegar a suas conclusões. Isso permite que outros estudiosos possam replicar os modelos e questionar os resultados. Dois casos recentes ilustram bem esse processo dos dois lados do espectro ideológico.

No ano passado, um estudante da Amherst College reviu os dados de um estudo de Carmen Reinhart e Kenneth Rogoff segundo o qual países com dívida alta em relação ao PIB tendiam a crescer mais lentamente – uma das bases intelectuais do movimento pela austeridade na Europa.

O problema é que os números estavam cheios de erros, o que fez a dupla ter que se retratar e negar que houvesse agido de má fé. 

Este ano, foi a vez do celebrado Thomas Pikkety ter que responder a críticas levantadas pelo Financial Times sobre dados e metodologias utiilizadas em seu bestseller “Capital no Século XXI”.

O debate não foi muito além – e o livro acabaria vencendo um prêmio do próprio jornal – mas o próprio Pikkety lembrou na época que isso é tudo parte do jogo: “A razão pela qual eu coloquei todos os meus arquivos excel online é precisamente porque quero promover um debate aberto e transparente sobre essas questões importantes e sensíveis de mensuração.”

Naturalmente, big data não significa necessariamente secret data. E no caso de empresas como Facebook e Google, transparência demais bate de frente com a preocupação de seus usuários em relação à privacidade e ao uso de seus dados pessoais. 

Mas na medida em que a pesquisa acadêmica caminha para uma multiplicidade de fontes muitas vezes exclusivas, cresce o risco de que eles se tornem reféns da boa vontade de empresas ou de algumas agências governamentais – pois mesmo dados teoricamente públicos podem estar sujeitos à confidencialidade.

“Para conseguir estes dados, economistas acadêmicos precisam desenvolver uma reputação de que tratam suas fontes de forma agradável. Assim, seus incentivos para servir à uma determinada indústria ou a uma autoridade política que controla os dados se torna similar aos dos reguladores”, lembra Luigi Zingales, da Universidade de Chicago, em um trabalho recente sobre o assunto.

O debate acadêmico não pode (e nem deve) voltar para trás – os ganhos e potenciais do big data são simplesmente muito fortes para serem ignorados. Mas como em qualquer outro campo, o aumento do sigilo requer uma visão clara também dos seus riscos.

“O principal remédio para reduzir a captura por interesses é a consciência por parte dos economistas de que este risco existe”, conclui Zingales.