O melhor pedaço da Maçã.

Se não pode vencê-lo, junte-se ao Gemini

TechCrunch
Gemini

Quem acessou o MacMagazine logo cedo na última segunda-feira (18/3) se deparou com uma das notícias mais improváveis dos últimos meses: segundo Mark Gurman (da Bloomberg), a Apple vem negociando com o Google para licenciar o uso dos modelos de IA Gemini no iOS 18.

Publicidade

À primeira vista, a notícia assusta. A reação instintiva é concluir que o Google terá acesso aos dados pessoais armazenados no iPhone, o que contraria completamente o discurso de privacidade que a Apple promove há anos. A boa notícia é que essa reação instintiva provavelmente está errada (como geralmente é o caso de reações instintivas).

Mas, para entender como o Google Gemini pode ser uma adição positiva à gama de funcionalidades de IA no iOS 18, vale olharmos primeiro para o que já existe no mercado.

Olhando primeiro para o que já existe no mercado

No fim do ano passado, o Google anunciou a família de modelos Gemini (que substituiu o Bard), composta por três variações: Nano 1Que tem duas subvariações: Nano-1 (com 1,8 bilhão de parâmetros) e Nano-2 (com 3.25 bilhões)., Pro 2Melhor do que o GPT-3.5 e pior que o GPT-4,, e Ultra 3Ainda mais potente, a ser lançado em breve..

Desenvolvida para “caber” em smartphones e rodar localmente, a variação Nano estreou no Pixel 8 Pro em dezembro, trazendo duas funcionalidades: geração inteligente de resumos no app Gravador de Voz e sugestão de respostas inteligentes no teclado GBoard 4Compatível apenas com alguns apps. O suporte à funcionalidade depende de cada desenvolvedor, o que não é ideal..

Demonstração da funcionalidade de resumo do Pixel 8 Pro.

Na época, o Google disse que o Gemini também seria liberado na versão não Pro do Pixel 8 no início de 2024, mas isso não aconteceu. Recentemente, a empresa explicou (sem detalhar) que limitações de hardware impediram a implementação.

Publicidade

Nesse meio-tempo, a Samsung anunciou a linha Galaxy S24, que também é fortemente apoiada no Google Gemini para oferecer funcionalidades de IA. Dentre elas, estão um interessante recurso de tradução de conversas em tempo real e a possibilidade de gerar textos para o app de Mensagens.

YouTube video
Evento Galaxy Unpacked 2024.

Já outro recurso que chamou bastante atenção foi o Circular para Pesquisar, que identifica a informação ou o objeto sobre o qual o usuário deseja saber mais a respeito e, em seguida, inicia uma busca no Google Lens sem a necessidade de ir para outro app. Na época, o próprio Google disse (também sem detalhar) que levaria essa funcionalidade a mais dispositivos em breve.

E no iPhone?

Pois bem. Aqui, também vale olhar para trás a fim de entender o que pode vir pela frente. Desde 2007, a Apple e o Google têm uma parceria para manter o buscador de Mountain View como o motor padrão de pesquisa do Safari.

Publicidade

O valor dessa parceria sempre foi especulado, mas só recentemente ele foi confirmado: 36% do faturamento publicitário que o Google gera a partir do Safari, o que correspondeu a US$18 bilhões apenas em 2021.

Publicidade

Se você se pergunta por que a Apple nunca lançou um buscador, essa pode ser uma das respostas. Ela tem um belo faturamento recorrente de um buscador, sem ter precisado construir (e passar pelos problemas regulatórios e dores de cabeça administrativas de ter) um.

No mundo da IA generativa, ela pode estar pensando em fazer algo parecido; apesar das aquisições, das contratações e dos estudos publicados nos últimos anos (incluindo um estudo recente interessantíssimo sobre IA multimodal, com desempenho superior a boas alternativas do mercado), não seria surpreendente se os primeiros produtos de IA generativa desenvolvidos pela própria Apple fossem ruins.

Isso porque os grandes modelos de linguagem ou funcionalidades de IA generativa disponíveis no mercado se tornaram verdadeiramente úteis apenas depois de muita tentativa e erro em público, e isso é algo que a Apple não costuma fazer.

Além disso, ela já não tem mais esse tempo a perder. Anunciar uma IA em junho, lançar em setembro, encontrar problemas graves e tirar do ar em outubro, trabalhar em correções em novembro e dezembro, e voltar a disponibilizar de forma gradual apenas em janeiro ou fevereiro de 2025 seria catastrófico, e consolidaria o que hoje é apenas a hipótese de que a Apple está bastante atrasada no mundo da IA.

Mas e a questão dos dados?

No caso da parceria entre a Samsung e o Google, há funcionalidades que utilizam o Gemini Nano e que oferecem recursos de LLM localmente, mas há funcionalidades que utilizam o Gemini Pro e que dependem da conexão com a plataforma Vertex AI do Google Cloud para funcionar. Existe a opção de desligar o envio de dados à nuvem, mas isso obviamente reduz a quantidade de funcionalidades de IA disponíveis no aparelho.

No caso da Apple, com a quantidade de processos anticompetitivos e desafios regulatórios que ela vem enfrentando e tentando combater com o argumento de “segurança e privacidade acima de tudo!”, não seria muito perspicaz abrir mão disso apenas para ter duas ou três IAs a mais nos iPhones (afinal, é óbvio que o Gemini não será responsável por todas as funcionalidades de IA que a Apple anunciará ao longo do ano).

Dito isso, é claro que tudo vai depender da implementação e de quais recursos do Gemini venham a ser incorporados ao iPhone. Fato é que, quanto mais uma IA sabe a seu respeito, mais eficiente ela fica: os textos ficam mais parecidos com o tom que você costuma utilizar, ela passa a identificar com cada vez mais precisão a sua voz para transcrever ou traduzir, entende melhor a sua expectativa e as suas preferências quando você pede para resumir algo, etc.

YouTube video
No fim de 2023, o Google fez um evento para anunciar funcionalidades de IA que seriam incorporadas ao Google Assistente. Na época, o Gemini ainda se chamava Bard.

Para que isso aconteça, a IA precisa ter acesso a esses dados para começo de conversa. Mas na hipótese de a Apple recorrer ao Gemini para oferecer coisas assim, se existir a opção de cada um decidir se vale ou não a pena fazer essa troca de privacidade por utilidade, maravilha. Eu já sei o que vou escolher.

A boa notícia para nós é que, do lado do Google, marcar presença 5Ou melhor, impedir que a OpenAI ou outros concorrentes marquem presença. no iPhone será muito mais valioso do que qualquer dado nosso que ele possa extrair. Alô, antitruste!

Ainda assim, vale considerar o seguinte: o vazamento dessa notícia, a essa altura do campeonato, não foi um acaso. Se ele veio do lado da Apple, provavelmente foi um artifício para sinalizar à OpenAI e a outras empresas com a qual ela vem negociando, que é melhor elas flexibilizarem os termos do acordo sob pena de perderem o contrato para o Google.

Por outro lado, se veio do lado do Google, pode ter sido uma manobra para criar a expectativa pública de que os iPhones contarão com uma IA que todos já sabem que funciona, dificultando a possibilidade de a Apple arriscar escolher um fornecedor pior.

Resumo da ópera

De um modo geral, a notícia de que a Apple poderá incorporar o Gemini ao iPhone para oferecer funções de IA verdadeiramente eficientes é ótima, desde que seja algo temporário. Assim, teremos ainda em 2024 acesso a uma tecnologia que a empresa pode precisar de um pouco mais de tempo para fornecer por conta própria.

Mais do que isso, não vai demorar nada para que as funções de IA generativa pareçam lugar-comum nos nossos telefones. Em breve, não poder contar com uma IA generativa fará um sistema parecer tão limitado quanto usar um smartphone sem conexão com a internet, ou sem tela sensível ao toque.

Por outro lado, não deixa de ser uma vergonha a Apple precisar recorrer ao Google aos 45 minutos do segundo tempo, considerando que há seis anos o chefe de IA dela é John Giannandrea, ex-líder de Busca e IA do… Google!

Em abril 2018, quando a Apple contratou Giannandrea, o histórico estudo “Attention Is All You Need”, de funcionários do Google com a invenção do modelo Transformer, já havia sido publicado há quase um ano. Olhando por esse lado, eu fico curiosíssimo para saber o que diabos Giannandrea fez durante esse tempo todo em Cupertino, e como justo ele pôde deixar o bonde da IA passar.

Seja como for, é certo que a Apple não recorreria a essa parceria com o Google se ela não fosse absolutamente necessária e, partindo dessa premissa, talvez adotar o Gemini seja a solução mais útil para resolver um problema com, espero, um prazo de validade bastante limitado.

Notas de rodapé

  • 1
    Que tem duas subvariações: Nano-1 (com 1,8 bilhão de parâmetros) e Nano-2 (com 3.25 bilhões).
  • 2
    Melhor do que o GPT-3.5 e pior que o GPT-4,
  • 3
    Ainda mais potente, a ser lançado em breve.
  • 4
    Compatível apenas com alguns apps. O suporte à funcionalidade depende de cada desenvolvedor, o que não é ideal.
  • 5
    Ou melhor, impedir que a OpenAI ou outros concorrentes marquem presença.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Post Ant.

MM Fórum: saúde da bateria de iPhone 13, M3 Pro vs. Max e mais!

Próx. Post

Vídeo: novo monitor Ninja Ultra grava em até ProRes RAW a 8K!

Posts Relacionados