São Paulo – “Bom dia. São 7 horas e a temperatura em Malibu é de 22 graus, com nuvens esparsas.” É com o anúncio da hora e da previsão do tempo que a jornalista Christine Everhart acorda depois de passar a noite na mansão de Tony Stark. A voz pertence a Jarvis, o computador falante de Stark, mais conhecido como Homem de Ferro. A cena faz parte do primeiro filme da série, lançado em 2008, mas já não é mais pura ficção científica, muito pelo contrário.

Assistentes inteligentes que falam, entendem a voz humana e respondem de volta são uma função básica em smartphones há alguns anos. Mais recentemente esses assistentes inteligentes começaram a chegar às casas com novas habilidades, como abrir e fechar a porta da garagem. Esse tipo de interação com os computadores é a nova fronteira da computação pessoal e, se depender de Google, Facebook, Amazon, Apple e Microsoft, não vai demorar até que estejamos tendo longas conversas com as máquinas.

A Apple foi a primeira empresa a popularizar os assistentes inteligentes com a Siri nos iPhones. Quando foi lançada em 2011, a Siri era mais uma promessa do que uma realidade. Com uma tecnologia rudimentar, muitas vezes não entendia as perguntas — todas em inglês — e executava apenas as tarefas mais simples, como abrir um aplicativo ou ler os compromissos da agenda. Mesmo com as limitações, uma secretária digital particular, dentro de um aparelho que nos acompanha quase 24 horas por dia, era, evidentemente, uma ideia poderosa. Várias versões depois, hoje a Siri entende dezenas de idiomas e executa muito mais comandos de voz.

A Apple foi a pioneira, mas quem está agora na dianteira é a Amazon. Em novembro de 2014, a empresa colocou à venda nos Estados Unidos o Echo (até hoje o produto não é vendido no Brasil). O aparelho é um cilindro preto equipado com alto-falante e um microfone multidirecional. Na época, ninguém sabia muito bem para que servia. Era possível escolher músicas e encomendar produtos da Amazon usando a voz, e não muito mais do que isso.

Mas o sistema do Echo, batizado de Alexa em homenagem à Biblioteca de Alexandria, foi ficando mais e mais esperto. Com o boca a boca pela internet — a campanha de marketing só veio um ano depois —, o Echo tornou-se um hit. A Amazon não divulga os dados de vendas, mas as estimativas são de 3 milhões de unidades vendidas em 2016 e a previsão é que cheguem a 10 milhões neste ano.

O Echo, com seu sistema Alexa, introduziu uma ideia nova e potencialmente revolucionária: controlar computadores sem a necessidade de interagir com uma tela. Quem pede recomendações de um restaurante japonês próximo de casa ouve uma lista de sugestões. Além disso, a Amazon tomou três decisões cruciais. Primeiro, criou o Echo como uma central de automação doméstica, para acender e apagar as luzes, por exemplo.

A segunda inovação foi transformar o sistema do Echo numa plataforma. Os smartphones têm aplicativos; o Echo tem skills (“habilidades”). Desenvolvedores independentes já criaram mais de 3 000 skills. Eles vão do trivial (contar piadas) a aplicações mais úteis, como informar horários de trem, chamar um Uber ou pedir uma pizza. A terceira novidade é que outras fabricantes terão a capacidade de incluir o Alexa em seus produtos — desde geladeiras até abajures. Outro exemplo são os carros da Ford. Em janeiro, a montadora americana revelou que vai incluir o sistema em seus veículos. Os motoristas poderão acionar a música com um comando de voz ou até trancar o carro a distância.

O sucesso surpreendente da Amazon levou o Google a lançar nos Estados Unidos em novembro um concorrente, o Google Home, aparelho com a aparência de uma pequena caixa de som (não há previsão para o início das vendas no Brasil). “Há décadas a indústria da tecnologia tenta simplificar a interface com o usuário, e não há nada mais simples do que a conversação”, diz Gummi Hafsteinsson, diretor de produtos do Google Home.

O Google largou relativamente atrasado, embora sua massiva base de dados e especialização em buscas representem vantagens importantes nessa corrida. Mas há mais gente grande na disputa. Especula-se que a Apple também esteja desenvolvendo um aparelho para ficar dentro de casa que utiliza a Siri. O Google e a Apple dominam as maiores plataformas digitais do mundo — iOS e Android — e não podem correr o risco de perder espaço no novo segmento.

Nessa disputa, o Facebook, maior rede social do planeta, corre por fora. A empresa também investe em interação, mas os esforços têm sido baseados em texto. “Notamos uma tendência global: as pessoas baixam cada vez menos aplicativos no smartphone”, diz David Marcus, responsável pela área de mensagens do Facebook. Marcus acredita que cada vez mais as interações acontecerão por intermédio de assistentes inteligentes, seja por voz, seja por escrito.

A empresa lançou no ano passado nos Estados Unidos um assistente chamado M, com base em seu aplicativo de mensagens instantâneas, o Messenger. Por enquanto, o M está disponível apenas para um pequeno grupo de usuários responsáveis por testes, mas a tecnologia já começa a aparecer no Messenger. Desde abril, o Facebook permite que empresas criem bots (uma contração de robots, ou “robôs”) para automatizar as interações com seus clientes — inclusive no Brasil.

Nos Estados Unidos, a rede de lojas de cosméticos Sephora permite que as usuárias tirem uma foto do rosto, enviem pelo chat e recebam a imagem de volta com um batom aplicado, por exemplo. O bot também permite agendar horários de maquiagem nas lojas. No Brasil, um dos melhores exemplos é o do banco Original. Usando o Messenger é possível checar o saldo da conta-corrente e transferir dinheiro entre contas do banco.

Alô? alô? alô?

Há quem acredite que as buscas que fazemos no Google serão, num futuro próximo, conversas com assistentes inteligentes. Mas a verdade é que a tecnologia ainda tem muito a avançar. Em primeiro lugar, os assistentes estão disponíveis em poucas línguas (a exceção é a Siri). Mas o maior obstáculo são mesmo as conversas. O sistema Alexa, do Echo, o Google Assistant, do recém-lançado Google Home e dos novos celulares do Google, a Siri, do iPhone, iPad e Mac, e a Cortana, do Windows da Microsoft, ainda não entendem 100% do que dizemos.

O aplicativo Hound, da empresa americana SoundHound, compreende formulações mais complexas — mas, como não é o sistema original de nenhum smartphone ou cilindro falante, seu alcance é limitado. A empresa licencia a tecnologia para sistemas automotivos e certos produtos da Samsung. “Nossa missão é ‘houndificar tudo’ ”, diz Katie McMahon, vice-presidente da Sound-Hound. “Imagine que você vai poder perguntar a previsão do tempo para a máquina de café enquanto prepara um expresso duplo.”

Já está claro que a questão não é mais se falaremos ou não com os eletrodomésticos, mas quanto eles poderão nos ajudar. Considere o processo atual para reservar um quarto de hotel no computador. Provavelmente tudo começa com uma busca na internet. Depois é preciso colocar as datas nos sites de comparação de preços. Feita a escolha, é hora de inserir os dados do cartão de crédito e receber a confirmação da compra por e-mail. Imagine se, em vez de todos esses passos, bastasse dizer a uma máquina: “Quais são os hotéis disponíveis no Rio de Janeiro para o próximo fim de semana com diária até 250 reais?” Respondidas uma ou duas perguntas a mais, a reserva estaria marcada.

A tecnologia ainda não chegou lá, mas esse dia não está muito distante, pelo menos de acordo com a expectativa das empresas. “A ideia é criar uma conversa com o usuário com o objetivo de facilitar a execução de tarefas”, diz Hafsteinsson, do Google. A inteligência dos assistentes digitais depende de computadores poderosíssimos e bases de dados enormes. Todos vivem na nuvem e estão em constante atualização. “Até 2026, todo aplicativo vai incorporar algum tipo de inteligência artificial”, afirma David Cearley, vice-presidente da consultoria Gartner. Quanto mais o tempo passa, mais as máquinas aprendem sobre nossos hábitos e preferências. Um mordomo digital tão bom quanto o do Homem de Ferro pode não estar tão longe assim.