Blog Domingos Costa

Notícias e Variedades
Google delineia futuro de seu mecanismo de buscas

Na sala de máquinas que aciona o seu serviço de buscas dominante, o Google recentemente colocou em operação um novo e poderoso recurso.

De acordo com o gigante das buscas, a nova tecnologia – um modelo de inteligência artificial em larga escala conhecido como MUM – um dia talvez possa transformar as buscas na internet em um serviço muito mais sofisticado, atuando como um assistente virtual de pesquisa e vasculhando a rede em busca de soluções para questões complexas.

Mas os críticos da empresa advertem que isso vem acompanhado de um risco claro: o de acelerar uma transição que já está levando o Google a fornecer mais respostas diretas a perguntas dos usuários, se interpondo entre eles e os demais sites e “internalizando” o tráfego de buscas, mantendo os usuários trancados dentro do universo do Google.

O sistema MUM – abreviatura de modelo unificado multitarefas – é a mais recente de uma série de atualizações que o Google vem realizando em seu mecanismo de buscas, nos bastidores, e a empresa afirma que elas trouxeram uma mudança de patamar na qualidade de seus resultados.

As mudanças incluem a introdução, uma década atrás, do “gráfico de conhecimento”, que definiu a relação entre diferentes conceitos, acrescentando certo grau de compreensão semântica ao processo de busca. Mais recentemente, o Google buscou aplicar sua tecnologia de aprendizado profundo a fim de melhorar a relevância das buscas, com um recurso chamado RankBrain.

“Acreditamos ter chegado ao próximo marco importante”, disse Pandu Nayak, o pesquisador do Google encarregado do MUM.

O Google ofereceu o primeiro vislumbre de sua nova tecnologia na conferência anual de desenvolvedores que a empresa realizou em maio, embora tenha fornecido poucas informações sobre como o sistema poderia ser usado. Em entrevista recente, Nayak disse que o MUM poderá lidar com “muitas das necessidades difusas de informação” que as pessoas encontram em suas vidas cotidianas, mas que elas não tenham ainda formulado como questões específicas sobre as quais pudessem pesquisar.

Ele oferece como exemplos a busca dos pais por escolas adequadas para seus filhos, ou os momentos em que uma pessoa sente a necessidade de iniciar um novo regime de condicionamento físico. “A pessoa está tentando descobrir uma boa rotina de condicionamento –qual seria a ideal para o meu nível?”, ele disse.

Usando um serviço de busca atual, “na prática, seria necessário converter essa necessidade em uma série de perguntas que você faria ao Google para encontrar a informação necessária”, disse Nayak. No futuro, ele indica, essa carga cognitiva será carregada pela máquina, que atenderá ao que ele define como “necessidades muito mais complexas e talvez mais realistas dos usuários”.

Nayak acrescentou que, um dia, as aplicações do MUM provavelmente se estenderão muito além das buscas. “Nós vemos a tecnologia como uma espécie de plataforma”, ele disse.

O MUM é o mais recente exemplo de uma ideia que vem ganhando muita popularidade no campo da inteligência artificial de linguagem natural. O sistema usa uma técnica conhecida como “transformador”, que permite que uma máquina observe palavras em contexto, e não como objetos isolados a serem equiparados por meio de análise estatística maciça –um avanço que permitiu um salto na capacidade das máquinas para “compreender”.

A técnica foi desenvolvida inicialmente pelo Google em 2018, mas sua demonstração mais dramática veio com o GPT-3, no ano passado, um sistema desenvolvido pela OpenAI que chocou muitos profissionais no campo da inteligência artificial com sua capacidade de gerar grandes blocos de texto que soavam coerentes.

Jordi Ribas, que comanda a área de engenharia e produtos no serviço de buscas Bing, da Microsoft, disse que isso tinha “causado uma corrida entre todas a companhias de alta tecnologia para desenvolver modelos maiores que representem melhor a linguagem”.

Quando a Microsoft mostrou seu modelo Turing de geração de linguagem, no começo do ano passado, afirmou que se tratava do maior sistema desse tipo já construído. Mas o GPT-3, mostrado meses mais tarde, era 10 vezes maior. O Google ainda não divulgou os detalhes técnicos do MUM, mas disse que era “mil vezes mais poderoso” que o BERT, seu primeiro modelo experimental que usa transformadores.

Mesmo com esse grande salto, no entanto, o Google enfrenta um desafio complicado. “As companhias de buscas vêm sonhando com o desenvolvimento da capacidade de responder perguntas complexas nos últimos 15 anos, mas descobriram que resolver esse problema era bem mais complicado do que esperavam”, disse Sridhar Ramaswamy, que foi vice-presidente da área de publicidade do Google e agora é presidente-executivo da Neeva, uma empresa iniciante de buscas.

“Existem tantas variações em tudo de complicado que fazemos”, disse Ramaswamy. “Tentar fazer com que o software compreenda essas variações, e nos oriente por elas, provou ser incrivelmente difícil na prática”.

Os primeiros usos do MUM envolvem tarefas de busca por trás das cenas, como ranquear resultados, classificar informações, ou extrair respostas de textos.

A dificuldade de medir a qualidade dos resultados de busca torna objetivamente difícil julgar o impacto de esforços como esse, e muitos especialistas questionam se outras tecnologias de busca novas conseguiram cumprir as expectativas que despertaram. Greg Sterling, um veterano analista de pesquisas, disse que muitos usuários de serviços de busca não perceberão muita melhora, e que as buscas por produtos continuam a ser altamente frustrantes, em particular.

As companhias de buscas, de sua parte, afirmam que testes internos mostram que os usuários preferem os resultados oferecidos pelas tecnologias mais avançadas. A capacidade de extrair respostas de textos já permite que o Bing ofereça resposta diretas a 20% das solicitações de busca que recebe, disse Ribas.

Para a maioria das pessoas, o impacto dos transformadores só deve se fazer sentir caso a tecnologia resulte em mudanças mais visíveis. Por exemplo, o Google diz que a capacidade do MUM para compreender tanto textos quanto imagens –com vídeo e áudio a serem acrescentados mais tarde– pode conduzir a novas maneiras de realizar buscas em tipos diferentes de mídia.

Atender às solicitações de busca mais “difusas” que Nayak tem em mente efetivamente resultaria em o Google extrair informações de lugares diferentes da web a fim de apresentar uma resposta muito mais precisa a cada solicitação específica.

“Isso consolida todas as atividades nas propriedades do Google”, disse Sara Watson, analista sênior do grupo de pesquisa de mercado Insider Intelligence. “O que aparecer naquela primeira página [de resultados de busca] pode ser tudo que o usuário deseja”. Um sistema como esse traria reações adversas dos provedores de conteúdo de todo o planeta, disse Watson.

O Google, que já está sob escrutínio das autoridades regulatórias em todo o mundo, nega que planeja usar o MUM a fim de manter mais tráfego dentro de seus sites. “Não vamos transformá-lo em um [sistema] de resposta a perguntas”, insistiu Nayak. “O conteúdo que existe na web é rico o bastante para garantir que fornecer respostas curtas não faça sentido.”

Ele também negou que destilar os resultados de múltiplas buscas em forma de um único resultado reduzirá o tráfego encaminhado pelo Google a outros sites.

“Quanto melhor você compreende a intenção dos usuários e a melhor forma de lhes apresentar informações que realmente desejem, mais as pessoas recorrerão às buscas”, ele disse. O efeito será “fazer crescer o bolo” para todos.

A publicidade vinculada a buscas, a espinha dorsal dos negócios do Google, pode encarar questões semelhantes. Reduzir o número de buscas de que um usuário precisa para responder a uma pergunta pode reduzir o espaço publicitário que Google teria para vender. Mas, disse Watson, “se a solicitação puder ser mais complexa e direcionada, o anúncio também será. Isso confere maior valor [aos anúncios], e potencialmente pode mudar o modelo de preços”.

Tradução de Paulo Migliacci

Conteúdo de divulgação pela Agência BDC. A responsabilidade dos conteúdos e respectivo autor e veículo de origem .