O melhor pedaço da Maçã.
Siri

E se não houver “Siri GPT” nenhuma?

A essa altura, a maioria dos leitores do MacMagazine provavelmente já deve pelo menos ter ficado sabendo que a Samsung fez um evento na última quarta-feira, o tradicional Unpacked, para anunciar a geração 2024 da sua linha principal de telefones.

Publicidade

O teaser do evento não deixava dúvidas: o foco seria em IA 1Inteligência artificial.. E assim foi. Bom, mais ou menos. Alguns recursos como o eficiente Circular para Pesquisar, que traz uma forma mais ágil e natural de usar o Google Lens, não é exatamente IA, apesar de ter sido apresentado como tal.

Já outras funcionalidades, como tradução de chamadas telefônicas em tempo real, edição avançada de fotografias e resumos de textos e de áudios 2Apoiada no recém-anunciado modelo Gemini do Google., essas sim abrem à linha Galaxy S24 algumas possibilidades que, até recentemente, eram impossíveis de serem oferecidas localmente em um smartphone 3Segundo a Samsung, algumas funcionalidades de IA serão gratuitas apenas até o final de 2025..

Por outro lado, sabe qual produto da Samsung não ganhou nenhuma novidade e sequer foi mencionado? A assistente virtual Bixby.

Quem dá menos?

É bem verdade que, quando o assunto é o mercado de assistentes virtuais, a Bixby raramente faz parte da conversa. Mas, sinceramente? A Siri também não deveria fazer. Enquanto o Google Assistente e até mesmo a Alexa 4Me refiro à experiência nativa em produtos da Amazon. O app da Alexa para telefones é bem limitado. ganharam novidades e integrações relevantes nos últimos anos, é difícil escolher entre a Siri, a Bixby e a Cortana para dar o título de assistente que menos evoluiu desde seus respectivos lançamentos.

YouTube video
Marques “MKBHD” Brownlee compara a Bixby, a Siri, a Alexa e o Google Assistente.

No caso da Cortana, a Microsoft tomou a decisão correta: deu cabo da sua insignificante assistente no ano passado e preencheu esse vácuo recentemente com o Copilot, fruto do acertadíssimo investimento de Satya Nadella na OpenAI.

Já a Bixby segue existindo na linha Galaxy S24, mas sem nenhuma funcionalidade ou habilidade nova. É exatamente a mesma experiência disponível hoje em dia. Ao invés de gastar os tubos na reformulação da sua assistente 5 A menor garantia de que ficaria bom., a Samsung optou por investir no emprego de IA em funcionalidades que permeiam o uso cotidiano de grande parte dos apps do telefone, valendo-se de uma conveniente parceria com o Google para acessar o modelo Gemini.

Nota rápida: a Apple ainda não detalhou oficialmente seus planos envolvendo a Siri e LLMs. Para facilitar a vida, vou chamar isso de “Siri GPT” ao longo do texto, mas vale lembrar que esse é apenas um nome especulativo.

Pensando nisso, aqui vai uma hipótese um pouco assustadora inicialmente, mas que poderá até fazer sentido no longo prazo: e se a aguardada “Siri GPT” não fizer parte dos planos de IA da Apple?

Olhando para o mercado

Nós já sabemos desde a metade do ano passado que a Apple vem investigando algo parecido com o ChatGPT, graças a um vazamento de Mark Gurman. Segundo ele, um seleto grupo de funcionários em Cupertino vem testando uma IA cujo codinome é Ajax, graças ao uso do JAX 6Biblioteca de código aberto do Google para projetos relacionados a aprendizado de máquina. do Google em sua base.

Mas e se isso for apenas uma ferramenta interna? O próprio Gurman disse que não havia previsão de lançamento público. Todos partimos da premissa de que ainda não havia previsão de lançamento público, mas agora começo a acreditar que talvez esse não seja exatamente o caso.

A contrapartida, claro, são todos os projetos e estudos de IA que a Apple vem fazendo. Eu mesmo, recentemente, explorei como um LLM 7Large language model, ou grande modelo de linguagem. local poderia ser poderoso no iPhone, valendo-se do acesso à totalidade dos documentos, comunicações, fotos e dados do usuário. Há, também, o estudo que otimiza o armazenamento de um modelo entre o SSD 8Solid-state drive, ou unidade de estado sólido. e a RAM 9Random access memory, ou memória de acesso aleatório., que comentei aqui.

Por outro lado, dado que a Apple começou a investir nisso apenas depois do sucesso do ChatGPT, não parece nada provável que ela lance a tal da “Siri GPT” tão cedo. Isso porque, além de precisar programar a “Siri GPT” propriamente dita, com atenção a todas as questões de privacidade e de segurança pelas quais ela preza (e que costumam atrasar projetos), ela também precisaria construir uma estrutura gigantesca de servidores, algo praticamente impossível atualmente dia dada a escassez de GPUs 10Graphics processing units, ou unidades de processamento gráfico. mais apropriadas para esse tipo de processamento.

Mas ela precisa lançar algo relativamente logo, certo? Por isso, parece muito mais provável e factível que ela adote basicamente uma estratégia parecida com a da Microsoft, que vem chamando de Copilot suas diferentes funcionalidades de IA, desde a ferramenta de automações do Windows, passando pela IA generativa de imagens do Paint e chegando à IA generativa de códigos no GitHub.

YouTube video
Algumas aplicações do Microsoft Copilot no Windows 11.

Uma IA grande ou várias IAs pequenas?

No mesmo texto em que falou sobre o Ajax, Gurman também comentou que diferentes equipes dentro da Apple vêm desenvolvendo funcionalidades de IA para plataformas como Pages, Numbers, Apple Music, Xcode e assim por diante.

E se a “Siri GPT” for a soma de tudo isso, e não apenas uma versão mais parruda da assistente que vem nos frustrando há mais de uma década?

Seria bem-vindo não querer jogar o telefone na parede cada vez que a Siri responde algo absurdo para uma pergunta ridiculamente simples? Sem dúvida. Mas seria muito mais útil poder contar com as possibilidades oferecidas por diferentes tipos de IA nos apps que já utilizamos todos os dias, incluindo apps de terceiros, dependendo de como a Apple fizer a implementação — alô, MLX!

Imagine ter algo como o Gamma, mas nativo do Keynote. Imagine ter algo como o Audiopen, mas nativo dos apps Notas, Mail, Mensagens e Gravador de Voz. Imagine ter algo como o Rewind, mas nativo do Spotlight. Imagine ter algo como o Captions, o Runway, o Pika, o Whisper e o HeyGen, mas nativo do Final Cut Pro ou até mesmo do app Fotos. E, falando em fotos, imagine algo com o poder do DALL·E, do Firefly ou do ControlNET para exercitar a criatividade. Isso sem mencionar funções equivalentes ao que a Microsoft implementou no Word, no Excel e no GitHub, mas no Pages, no Numbers e no Xcode. Ah, e é claro que uma IA generativa parecida com o ChatGPT nos apps Mail, Mensagens ou Notas também viria bem a calhar para resumir, organizar, melhorar a escrita, dar ideias, etc.

Por melhor que a Siri possa se tornar um dia, ela sempre representará apenas uma fração do uso que damos aos nossos dispositivos. Não faz bem mais sentido tornar o resto do aparelho mais inteligente, também?

É claro que a Apple pode fazer igual ao que Microsoft fez com o Copilot e passar a se referir a todas as funcionalidades, novas ou já existentes de IA, como “Siri”. De certa forma, é o que a Samsung também fará com o termo Galaxy AI e o que o Google está tentando fazer com as marcas Bard, Gemini, Assistente, Assistente com Bard, etc. Uma dia eles se resolvem.

No fim das contas, o nome ou a forma como a Apple decidirá amarrar todos esses conceitos é apenas (ainda que importante) uma questão de comunicação. Mas fato é que, tendo conhecido, testado e adotado múltiplas ferramentas de IA que vão além do ChatGPT, mesmo que a Apple consiga fazer um clone perfeito do LLM da OpenAI na voz da Siri, isso tem começado a parecer um tanto limitado, não?

Notas de rodapé

  • 1
    Inteligência artificial.
  • 2
    Apoiada no recém-anunciado modelo Gemini do Google.
  • 3
    Segundo a Samsung, algumas funcionalidades de IA serão gratuitas apenas até o final de 2025.
  • 4
    Me refiro à experiência nativa em produtos da Amazon. O app da Alexa para telefones é bem limitado.
  • 5
    A menor garantia de que ficaria bom.
  • 6
    Biblioteca de código aberto do Google para projetos relacionados a aprendizado de máquina.
  • 7
    Large language model, ou grande modelo de linguagem.
  • 8
    Solid-state drive, ou unidade de estado sólido.
  • 9
    Random access memory, ou memória de acesso aleatório.
  • 10
    Graphics processing units, ou unidades de processamento gráfico.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Post Ant.

MM Fórum: monitor externo com a tampa aberta, rede celular no Apple Watch Ultra 2 e mais!

Próx. Post

Como nomear as janelas no Microsoft Edge do Mac

Posts Relacionados