Para os cientistas de dados não há desemprego

Mesmo em época de desemprego em alta, é grande a demanda por cientistas de dados — profissionais que extraem informações valiosas do oceano de arquivos digitais

São Paulo – Raiva, frustração, impaciência, decepção. Todos os dias, a operadora de telefonia Vivo depara com reclamações de centenas de milhares de clientes que entram em contato com a central de atendimento. Por sorte da empresa, a tecnologia tornou possível prever o comportamento dos clientes.

Basta colocar em ação softwares avançados, especializados na análise de linguagem, que capturam as emoções humanas por meio da entonação da voz, da construção das frases e do ritmo da fala dos clientes. Um simples suspiro pode indicar um consumidor à beira de um ataque de nervos.

A tecnologia transforma um imenso volume de dados subjetivos em informação valiosa. Com isso a companhia pode, por exemplo, iden­tificar quem está altamente propenso a cancelar planos de telefonia ou migrar para a concorrência, e saber a melhor hora de oferecer descontos e vantagens personalizadas a clientes insatisfeitos.

O responsável por essa tarefa de montar algoritmos e modelos matemáticos que entendem informações incompletas e as transformam em conhecimento valioso para as empresas é o cientista de dados, uma das profissões que estão mais em alta neste momento de demissões em massa.

Dos perfis das redes sociais aos padrões de trânsito, do histórico médico dos pacientes aos hábitos de compras dos consumidores, a vida das pessoas tornou-se uma coleção de informações digitais. Dentro das empresas, bancos de dados descomunais vêm sendo formados e só tendem a aumentar no futuro.

Tudo isso faz parte do big data, uma área de negócios cada vez mais essencial nas grandes companhias. O big data é regido por três forças: volume, variedade e velocidade de dados. Cerca de 2,5 bilhões de gigabytes de dados são criados diariamente, o suficiente para encher 156 milhões de iPads.

Esses dados vão se acumulando em diferentes formatos — como e-mails, comentários no Facebook, fotos publicadas em redes sociais e transações bancárias — e numa velocidade cada vez maior. O problema é que essa extraordinária massa de informações é formada, em sua maioria, pelos chamados dados não estruturados.

Ao contrário de uma lista de endereços numa planilha, em que o nome de uma pessoa aparece relacionado ao local onde ela reside, as informações não estruturadas estão soltas dentro de uma troca de e-mails ou nos relatórios de operação de uma empresa. É aí que entra a figura do cientista de dados, capaz de extrair informações úteis de onde impera o caos.

“Esse profissional é alguém que consegue unir dados desconexos, apontar tendências e ajudar na tomada de decisões”, afirma Antonio Celso Freitas Leitão, líder da área de big data e analytics da IBM Brasil. A atual ênfase dada a esse profissional marca uma nova fase da indústria de TI.

O avanço do setor nos últimos 50 anos começou com a automação de tarefas repetitivas e tediosas. A partir da década de 60, com a popularização dos primeiros computadores, já não era preciso datilografar várias vezes as versões de um processo legal em escritórios de advocacia. Sistemas de reservas de passagens aéreas ganharam espaço a partir da década de 70.

Dez anos depois, os caixas automáticos espalharam-se pelo mundo. No caminho, foram ficando para trás os empregos de secretárias e de caixas de banco e aumentando o de programadores de software. Como resultado, a economia foi ganhando produtividade. O big data, por sua vez, é um fenômeno diferente. Também tem como principal meta elevar a produtividade, mas corre em outra raia.

“O big data não se resume a um processo de automação. Seu objetivo é entender melhor o que acontece numa empresa, o que os clientes querem e, assim, modificar o negócio”, diz Jorge Sanz, diretor do Centro de Business Analytics da Universidade Nacional de Singapura, um dos grandes centros de big data da Ásia. Esse processo requer softwares capazes de captar os dados relevantes — e, acima de tudo, pessoas treinadas para interpretá-los.

Boa parte das vagas de cientistas de dados é ocupada por matemáticos, estatísticos e físicos. Mas engenheiros e profissionais de exatas com especialização em sistemas complexos ou em computação também têm sido assediados.

“O trabalho do cientista de dados requer tanto habilidades analíticas avançadas quanto um interesse por negócios”, afirma Diego Mariz, gerente da consultoria de recrutamento inglesa Michael Page. Gente assim ainda é coisa rara no mercado brasileiro. “A maioria dos profissionais está em formação, tentando entender como seu conhecimento pode gerar valor para as empresas”, diz Mariz.

A escassez se reflete nos salários. Ao longo de toda a carreira, os cientistas de dados têm remuneração superior à dos técnicos, que até o surgimento do big data eram os responsáveis por cuidar da manutenção dos bancos de dados. No Brasil, um profissional recém-formado pode ganhar até 6 000 reais, enquanto os gerentes chegam a receber cerca de 20 000 reais.

Segundo a empresa de recolocação americana Glassdoor, os profissionais do big data também são valorizados nos Estados Unidos. Lá, o ganho médio de um cientista de dados em início de carreira é de 10 000 dólares mensais, o dobro do de um programador.

Germano Lüders / EXAME

Camargo, da TAM: o matemático analisa os dados da companhia para ajudar a equipe de manutenção de aeronaves

O atual cenário é muito diferente daquele encontrado entre os anos 70 e 90, quando a taxa de desemprego de matemáticos e estatísticos era de 13% — o dobro da média americana. “Hoje, a disputa por esses profissionais é global e deve persistir por pelo menos uma década”, diz Elias Baltassis, diretor da consultoria BCG. De acordo com dados do setor, o déficit de profissionais pode chegar a 380 000 vagas no mundo em 2018.

No Brasil, a expressão “análise estatística e prospecção de dados” foi a mais buscada por recrutadores no ano passado, de acordo com um levantamento recente da rede social LinkedIn. É o único termo que ficou entre os quatro mais procurados nos 14 países pesquisados.

“Tomar decisões baseadas em dados não é uma moda. É uma mudança permanente na mentalidade de gerentes e executivos. As companhias que ainda não chegaram lá estão correndo para não ficar atrasadas”, diz Anindya Ghose, professor da Universidade de Nova York, especializado em análises de dados nos negócios.

A corrida por cientistas de dados tem relação direta com os ganhos de eficiência e a redução de custo que o big data é capaz de trazer para diferentes áreas das empresas. Funcionário da TAM, o matemático Jhean de Camargo ajuda um time de 60 funcionários da companhia aérea a planejar a manutenção de todos os 163 aviões da frota no país. Cabe a Camargo prever eventos atípicos, ou seja, aqueles que não estão em nenhum manual. “Ao tornar cenários incertos um pouco mais previsíveis, ajudo a equipe de manutenção a agir com maior eficiência”, diz.

Em um projeto recente, a tarefa era estimar os efeitos da alta temporada nos voos. A previsão inicial era contratar 40 mecânicos. O matemático, porém, foi cavar nos registros da própria TAM e descobriu que, analisando diferentes variáveis, como horários de pico nos mais de 40 aeroportos em que a companhia opera, tempo de deslocamento de mecânicos de uma base para outra e custo de horas extras, era possível elaborar um plano de realocação de funcionários.

“No final, não precisamos contratar ninguém e deixamos de gastar 3 milhões de reais”, diz Sérgio Novato, diretor de engenharia e manutenção da TAM.

O papel dos cientistas de dados, portanto, é tirar mais eficiência de estruturas muitas vezes já azeitadas. Estimativas apontam que as companhias que utilizam ferramentas de big data podem registrar ganhos de 5% em produtividade. Isso motiva setores que tradicionalmente já faziam análises de seus bancos de dados, como o financeiro, a ampliar a busca por esse tipo de profissional.

“Em 2012, minha área era composta de 15 pessoas. Hoje somos mais de 100”, diz o matemático Sandro Sinhorigno, de 42 anos, superintendente de modelagem estatística do banco Itaú. Segundo ele, é necessário revisar a todo momento as técnicas de previsão de inadimplência e identificação de fraudes.

Para isso, os cientistas de dados do banco passaram a cruzar informações da própria instituição com os registros de cartórios e de lojas. “Recentemente, participamos de um projeto que possibilitou aumentar 20% os valores de contratação de crédito sem extrapolar a margem de risco”, diz Sinhorigno.

Se em um primeiro momento o trabalho dos cientistas de dados tem sido melhorar as operações e reduzir custos, o próximo passo é utilizar as informações coletadas no desenvolvimento de novos produtos, o que ainda é raro. “O grande valor vai surgir quando as empresas conseguirem criar novas formas de ganhar dinheiro com esses dados”, diz Pietro Delai, gerente de pesquisas da consultoria IDC, especializada no setor de tecnologia.

A área de desenvolvimento é a segunda que deve ser mais impactada pela análise de dados nos próximos cinco anos, segundo uma pesquisa da consultoria Accenture com 1 000 empresas de 19 países, inclusive do Brasil. A área de desenvolvimento só perde para a de relacionamento com clientes.

Por enquanto, os exemplos mais bem-acabados de bom uso de big data estão no varejo. “As lojas nunca colecionaram tantos detalhes sobre o comportamento de consumo de seus clientes como agora”, afirma Eduardo Ramalho, presidente da Acxiom no Brasil, multinacional que reúne um dos maiores bancos de dados globais sobre perfis de consumidores.

No Brasil, a divisão de comércio eletrônico do Walmart, braço online da maior rede varejista do mundo, tem mergulhado em seus bancos de dados para aprimorar as estratégias de vendas. Desde o primeiro momento em que um cliente visita o site da empresa, todos os seus passos são monitorados.

Um sistema captura quais palavras ele digita na busca, o que coloca e tira do carrinho, entre outras variáveis. Em seguida, os algoritmos cruzam as informações e encaixam o visitante em um grupo de consumidores com hábitos semelhantes.

“Um bom algoritmo pode ser responsável por 10% a 20% do faturamento de uma campanha de vendas”, explica o estatístico Emanuel Matos, responsável por aperfeiçoar os algoritmos de recomendação de compra. Há um ano, sua equipe decidiu acrescentar uma vitrine personalizada de produtos na versão para celulares e tablets da loja. “A iniciativa aumentou 8% as vendas no canal por meio de celulares e tablets”, diz Matos.

A estatística é pop?

Por mais que seja um fenômeno recente, os cientistas de dados já começaram a ganhar notoriedade. Em 2012, o estatístico americano Nate Silver, fundador do blog 538, ficou conhecido ao acertar o resultado das eleições presidenciais em todos os 50 estados americanos. Ele cruzou mais de 4 000 fontes de informação para construir suas previsões. Silver cravou que o presidente Barack Obama teria 50,8% dos votos — ele teve 51,06%.

O estatístico, cujo blog foi comprado pelo canal esportivo ESPN, ajudou a popularizar a ideia de que a carreira é sexy, mesmo que boa parte desses profissionais se encaixe no estereótipo de nerd. No Brasil, porém, a ciência dos dados ainda não despertou interesse entre os pretendentes a uma vaga nas universidades.

Em 2013, o país formou 114 000 profissionais de exatas. Desse total, menos de 10% eram matemáticos, estatísticos e físicos — percentual que piorou nos últimos anos. Segundo a consultoria Hoper Educacional, entre 2009 e 2013, o número de alunos que concluíram esses cursos na graduação caiu 16% nas faculdades privadas e 5% nas públicas.

Mesmo quem tem um diploma na área de exatas muitas vezes não desenvolve na faculdade uma visão voltada para a área de negócios, uma parte crucial da formação de um cientista de dados. Aqui e lá fora, os cursos de big data começaram a surgir em maior número em 2014. A Universidade Harvard, nos Estados Unidos, optou por criar disciplinas alternativas para os cursos de economia, administração e engenharia.

Até o momento, cerca de dez faculdades brasileiras oferecem especialização, MBA ou mestrado no tema. Com a taxa de desemprego em 9% e o mercado de trabalho demandando cientistas de dados, é muito provável que a procura pelos cursos dessa área aumente de forma dramática nos próxi­mos anos. Será a revanche dos nerds.